一个开源桌面机器人的从 0 到 1

目录

简介

一个从社区「长出来」的产品

「可爱」是一个被低估的产品定义

硬件选型的成本账

开源的三个红利

四个可以拿走的原则

作者简介


简介

如果你这两年关注 AI 硬件赛道的话,大概率会产生一种割裂感。

一边是钱在往里涌。

大模型厂商在找硬件载体,VC 在投「下一代计算平台」,CES 展上涌现了大量 AI 硬件。

一边是产品在往外倒。

AI Pin 凉了,Rabbit R1 被骂成「一个 App 就能解决的事」,大部分 AI 硬件在发货三个月后就没了声响。

核心问题其实很朴素:

先把 AI 够不够强放一边,回答一下:硬件产品的基本功还在不在?

就在这个背景下,一个售价 65 美元、体积不到巴掌大的开源桌面机器人,最终拿下 358 万港币、4142 名支持者。

它叫 StackChan。

我想用它拆一个更本质的问题:

AI 硬件从 0 到 1,到底该怎么做。

一个从社区「长出来」的产品

StackChan 的起点没有 PRD。

2021 年,日本工程师 Shinya Ishikawa 做了一个小机器人原型,把自己的头像显示在屏幕上,两个舵机带动它左右转头、上下点头。

代码和 3D 模型全部开源,放到了 GitHub 上。

这个原型谈不上「产品」------没有 App,没有 AI,外壳也是 3D 打印的。

但它在一个小众圈子里传开了。

接着发生了三件事:

  • Takao Akaki 看到了,把它做成了 DIY 套件,在日本创客市集上分发了一千多台。用户不用自己买零件自己画外壳了,拿到手就能组装。
  • Robo8080 把 OpenAI API 接了进去。机器人突然「会聊天了」------它从一个会转头的屏幕,变成了有表情、有回应、能对话的东西。
  • M5Stack 看到了前两步的社区信号,决定产品化。重新做工业设计、做模具、做固件、做 App、上 Kickstarter。

前后四年。

注意这个顺序:

社区验证跑在了产品定义前面。传统硬件是「市场调研→MRD→PRD→开发→测试→上市」,假设全部锁在内部。

StackChan 是「开源原型→社区扩散→信号放大→官方接手→产品化」。

产品化启动的那一刻,需求已经不用猜了。

一千多个人买过 DIY 套件,GitHub 上有几千个 Star,Discord 和 Facebook 群里讨论活跃。

M5Stack 不需要做市场调研去问「用户会不会为桌面机器人付费」,社区用户已经用钱包回答了。

需求自己从社区里冒出来的。

产品经理的工作是接住它。

「可爱」是一个被低估的产品定义

做 AI 硬件最容易犯的一个错误就是堆功能。

「它能聊天,能做智能家居,能当监控摄像头,能远程视频,能编程教学......」

功能越多,定位越模糊。

定位越模糊,用户越不知道为什么要掏钱。

StackChan 做了一个很聪明的取舍。

它的核心价值主张就两个字:可爱。

屏幕上的表情是可爱的。

转头歪头的动作是可爱的。

12 颗 RGB LED 组成的耳朵会发光,也是可爱的。

连名字里那个「Chan」------日语里的亲昵后缀------都在强化这个东西。

有个细节值得注意。

项目发起人 Shinya 说过一句话:「かわいいが沼をつくった」------是可爱造出了这个沼泽。

他的意思是,可爱把参与门槛压低了。

一个冷冰冰的「AI 语音助手终端」没人在意。

一个会歪头、会脸红、会跳舞的小家伙,让人想摸它、给它换衣服、让它做点不一样的事。

「可爱」放在 PRD 里可能没人当真。

但在 StackChan 身上,它是一个精确的功能定义:

  • 屏幕用 2.0 英寸 IPS 圆角屏,不用更大更贵的方案------大了可爱感就没了;
  • 舵机只做水平旋转和垂直俯仰,不碰行走轮、机械臂------动作越简单越像小动物;
  • 出厂预装的表情动画,打磨得比 AI 对话逻辑还用心------用户拆箱的第一感受是表情,不是智力。

用 MoSCoW 优先级来看,StackChan 把「可爱」放在 Must have,把「强 AI 能力」放在 Should have。

数据也印证了这个取舍。

Kickstarter 页面上,展示表情动画和动作的 GIF 动图占了视觉内容的一半以上。

评论区用户讨论最多的话题是「怎么换外壳」「能不能让它学我说话」「收到之后太可爱了」------AI 对话质量的讨论反而排在后面。

AI 是加分项。

可爱是必选项。

这里有一条更通用的判断:

做 AI 硬件,先把产品的「非 AI 价值」定义清楚。

产品去掉 AI 之后什么都不剩,这个产品大概率死在半路上。

StackChan 拿掉 AI,它还是一个会转头会做表情的可爱摆件。

这个底盘是稳的。

硬件选型的成本账

说完产品定义,聊聊硬件方案。

StackChan 的主控是乐鑫 ESP32-S3,240MHz 双核,16MB Flash + 8MB PSRAM。

两个层面的考量。

成本控制:ESP32-S3 是成熟方案,量产稳定,供应链简单。

一颗不到 3 美元的芯片,搭配摄像头、麦克风、舵机、屏幕,整机 BOM 控制在 30 美元以内是可能的。

这就解释了为什么超级早鸟价能做到 59 美元还有利润。

AI 能力分配:ESP32-S3 没有 NPU,跑不了本地大模型。

StackChan 也没打算在本地跑------语音识别和 LLM 推理全走云端,端侧只做唤醒词检测、表情渲染和舵机控制。

「弱终端 + 强云端」这条路一打通,硬件成本直接下来了。

对比一下。

AI Pin 和 Rabbit R1 都用高通骁龙,BOM 成本 100-200 美元,零售价 200-700 美元。

高算力→高成本→高用户预期→预期没被满足→口碑灾难。

StackChan 反过来走。

低算力,低成本,低用户预期。

然后用「可爱」和「开源」来做超预期交付。

停一下。这里有个被大量 AI 硬件项目忽略的东西------

一台设备的成本,决定了你能承受多大的失败。

65 美元的设备,用户容忍度天然比 699 美元的设备高。

成本越低,迭代空间越大,试错代价越小。

硬件不像软件,你没法发一个热修复。

批量化阶段一个错误,可能就是毁灭性的。

M5Stack CEO 赖景明在 CES 2026 上说过一句:「这是我们第一次尝试面向普通消费者的产品。」

注意,一个做了八年模块化开发板的公司,第一次做 2C,选的是一个 65 美元的桌面机器人。

这是在用最小的成本,验证最大的那个假设------「普通消费者会为一个 AI 桌面伴侣掏钱吗?」

验证这个,65 美元够了。

开源的三个红利

StackChan 的软件、固件、硬件设计全部开源,Apache 2.0 协议。

但我更想聊的是开源带来的三个结构红利。

把用户变成贡献者。

不止一个人给 StackChan 写过自定义固件。

有人接入 Home Assistant 做智能家居控制。

有人改了 TTS 让它支持希腊语。

有人在 GitHub 上提 PR 修了唤醒词检测的 Bug。

这些动作,本质上是在免费帮 M5Stack 做产品迭代。

传统硬件公司要花钱养一个软件团队维护固件。

StackChan 靠社区做到了类似的效果------评论区有人抱怨「唤醒词 95% 不响应」,不到两周就有人提交了优化方案。

降低买之前的心理障碍。

闭源硬件,买了就买了,不好用就吃灰。

开源硬件,用户心里想的是「大不了我自己改」。

从「被动消费者」变成「主动参与者」------这个心理切换非常关键。

参与基线越高,退换货概率越低,口碑传播概率越高。

开源是渠道。

M5Stack 每周五发布新品,七年累计 424 款产品。

StackChan 是最出圈的一个。

不是技术最强,是开源社区让它自然穿透了 30 多个国家。

传播成本天然低于广告投放。

StackChan 没花站外投放的钱,靠的是 GitHub Star、Discord 讨论、创客圈口口相传。

这种传播效率,在消费电子里很少见。

IPD 流程里有一个核心原则:

产品开发是持续验证和优化,不是一次性的。

开源社区就是 StackChan 的持续验证引擎------用户自己会来告诉你哪里好、哪里烂、哪里可以改。

你不需要花钱请人做用户访谈。

四个可以拿走的原则

回到最初的问题:AI 硬件从 0 到 1,到底该怎么做?

从 StackChan 身上提炼了四条。

先定义「非 AI 价值」,再加 AI 能力。

团队很容易把所有注意力放在「AI 能干什么」上,忘记问「AI 不干活的时候,这东西还值不值钱」。

StackChan 拿掉 AI 对话,还是一个会转头会做表情的摆件。

如果拿掉 AI 只剩一个塑料壳------产品定义本身就有问题。

能用社区验证的假设,别用内部讨论替代。

StackChan 在产品化之前,通过社区 DIY 套件完成了最小范围的需求验证。一千多个用户用钱包和时间投票,比任何市场调研报告都真实。

对 AI 硬件创业者来说,「有没有一个小众社区已经在围绕你的想法自发行动了」------这个问题比「竞品分析做了吗」更前置。

成本越低,验证空间越大。

一款新硬件开发周期 1.5 到 2 年,批量化犯错的后果是毁灭性的。

选 ESP32-S3 不选高通骁龙,不是技术路线的优劣问题------是「给自己留多少次试错机会」的风险决策。

65 美元不是低端,是低风险。

让用户同时做你的开发者和传播者。

开源、社区、可定制------三件事叠在一起,能产生传统硬件公司很难想象的杠杆。

不需要 100 人软件团队,不需要几百万营销预算。

把产品做得够开放、够可爱、够让人想动手玩,用户自己会来帮你做剩下的。

写到这里,StackChan 给我的最大感受其实不是「AI 硬件有机会」。

是它做对的那些事------社区共创验证需求、低算力控制试错成本、开源替代投放预算、「可爱」打穿消费者第一道防线------这些跟 AI 技术本身没什么关系。

跟怎么做产品有关系。

这一波大模型浪潮,很多人在找「AI 原生硬件」的终极形态。

StackChan 的示范不复杂:

不用急着定义终极形态,先用最小成本验证一个真实需求。

社区有信号就去接住,用户愿意掏钱就放大,反馈来了就迭代。

一条一条来。

作者简介

卫朋,《硬件产品经理》作者,人人都是产品经理受邀专栏作家,CSDN认证博客专家、嵌入式领域优质创作者,阿里云开发者社区专家博主。

相关推荐
坚果的博客2 小时前
鸿蒙PC三方库适配OAT.xml 与 SHA512SUM 解读:开源合规与源码校验
xml·开源·harmonyos
阿昌喜欢吃黄桃2 小时前
Java优质开源AI项目
java·ai·langchain·开源·rag·springai·langchain4j
沫儿笙3 小时前
安川焊接机器人弧焊节气装置
人工智能·机器人
hujinyuan201604 小时前
电子学会青少年机器人技术(一级)等级考试试卷-真题+答案(2026年3月)
机器人
咖啡星人k4 小时前
AI原生应用架构设计:MonkeyCode开源引擎的技术内幕
开源·ai-native
myenjoy_14 小时前
开源!Go+Wails+Vue3 手搓一个 PLC 实时监控桌面工具
开发语言·golang·开源
来让爷抱一个4 小时前
MonkeyCode vs Copilot vs Cursor:三大 AI 编程工具对比
开源·ai编程
坚果的博客4 小时前
【鸿蒙 PC三方库构建系统】README.OpenSource 文件深度解读
华为·开源·harmonyos
创世宇图4 小时前
TradingAgents 新手快速上手指南
开源