字节AI撒“豆”成兵

一场正在发生的硬件宇宙大爆炸。

作者|景行

编辑|古廿

一颗AI豆,正在打开新的录音体验。

有投资人下单体验后,在朋友圈晒图评价:"感觉国内这个赛道彻底结束了"。

在他看来,这款产品是中国最好的软件体验公司和最好的硬件体验公司能力得全面结合,产品力惊人。

在此之前,他日常使用的同类产品是Plaud,也是当前AI录音硬件中完成度较高的一类。

1月19日,飞书与安克创新联合推出一款硬件:安克AI录音豆。10克重,磁吸式设计,接近咖啡豆大小。整个产品落地中,飞书提供相关的AI软件功能,安克创新则负责提供设备的硬件基础。

这是一款早在去年9月份,安克创新就在海外发布的硬件产品:声阔AI录音豆,海外版本支持ChatGPT-4.1进行录音总结。

对比国内和海外两个版本的产品。声阔AI录音豆在硬件层面早已成型,飞书仅是在原有的硬件基础上进行了软件优化,将产品从一款独立硬件转变为融入飞书生态的工具。

而这只是字节近期硬件布局的冰山一角。

从与中兴通讯合作推出nubia M153豆包AI手机,到与龙旗科技研发AI眼镜、发布豆包自研的Ola Friend智能体耳机,再到与歌尔股份合作开发AI智能耳机,以及同赛力斯、奔驰推进火山引擎智能座舱项目,最近半年时间,字节的硬件版图正在迅速扩张。

**值得注意的是,相比1.0阶段入局硬件赛道的方式,目前字节的打法明显转变。**有接近字节硬件业务的相关人士透露:"今年年初的CES大会,字节就已经开始去扫货了。主要看整个消费硬件市场的流行趋势和对应的硬件产业链成熟度"。

元宇宙时期的1.0硬件阶段,字节追求砸钱自建硬件团队的模式,用收购从无到有搭建起软硬一体化的完整团队,先收购VR硬件团队拿下虚拟现实世界的门票,再逐步延伸至产业链收购,乃至自己研发MR设备专用芯片。

而在AI时代的2.0硬件阶段,字节不再追求全面掌控,而是定位于软件生态赋能商,从中兴Nubia M153豆包AI手机,到与龙旗科技合作开发的豆包AI眼镜,再到此次AI录音豆,字节的动作显得更加轻快。

当字节的硬件模式转向寻找市面上成熟的代工厂,为AI技术寻找落地的终端场景。元宇宙时期积累的团队与技术,开始在AI硬件时代开花结果。

01 元宇宙种因,AI硬件结果

太平洋两岸,发力元宇宙的Meta与字节跳动,都在走一条由重转轻的路线。

作为字节的模仿对象,在累计亏损超过700亿美元之后,Meta的元宇宙梦正在醒来。

近期,Meta宣布对元宇宙核心部门Reality Labs进行大规模裁员,规模约为1000到1500人,约占该部门员工总数的10%以上,主要覆盖VR硬件、元宇宙社交平台Horizon Worlds等岗位。

Meta表示,此次调整后,节约的资金将用于可穿戴设备业务,部门战略从重资产的元宇宙项目,转向相对模式更轻的AI设备,如AI眼镜、手机AI助手等。

以AI眼镜为例,2024年Meta与欧洲眼镜巨头Essilor Luxottica联合发布的Ray-Ban Meta眼镜一度因需求旺盛导致断货,Meta正在考虑到2026年底,将Ray-Ban Meta眼镜年产能提升至2000万件以上。

字节的布局与此类似,做元宇宙头显设备,选择是效仿Meta+Oculus模式,产品所有关键环节都要抓在手里。

以字节收购VR硬件赛道龙头PICO为起点;在内容层面,字节收购二次元虚拟社交应用"Vyou微你"的持有方波粒子科技,并将团队并入PICO社交中心,负责为头显设备填充内容;在上游硬件领域,字节先后投资光舟半导体与昕原半导体,用于为VR头显提供光学模组与存储芯片。

尽管元宇宙时期的硬件探索未能实现商业闭环,但这一时期的字节完成了锤子手机、PICO等被收购硬件企业的资源整合。这个阶段字节积累的硬件经验和资源,意外地为AI硬件时代铺平了路。

其中最具代表性的就是人才。

比如,豆包手机的主力研发团队是字节旗下AI硬件团队Ocean,隶属于字节AI产品部门Flow,核心成员主要来自字节收购的锤子手机、VR头显PICO、智能耳机Ola Dance等硬件团队及近年引入的手机硬件人才。

推出PICO 4的经验,让字节完整经历了一个硬件研发、生产和销售周期的成熟流程,也是目前字节进军AI眼镜、耳机等产品的基础。

过去多年,几乎所有字节收购的硬件业务,都先后经历裁员、打散、重组,核心业务负责人离职等难称乐观的表现。但这些阵痛或许也是字节将收购硬件资源融入自有生态体系的一种必然。

02 打开硬件厂的想象力

"看枪打鸟,看上100个,基本明年就知道能抄什么东西就行了,非常清晰。"

有接近豆包的人士透露,在今年的CES大会上,字节正在全力扫货,寻找可供借鉴的AI硬件产品并模仿学习,以确定后续产品线的方向。

在APP工厂时代,字节跳动以暴力增长的闪电战能力著称。但在元宇宙时期,字节跳动陷入研发周期过长、资本开支过大的泥沼,和Meta一样,大量的时间及资金投入后,仍然未能证明元宇宙商业模式前景。

**而在AI硬件层面,字节回到自己最熟悉的增长节奏上来。**在最短时间内模仿、学习、超越。而解决速度问题最有效的办法,就是寻找市面上成熟但未能热销的硬件产品及生产企业,并对其加以"灵魂改造"。

以此次飞书联合安克合作发布的AI录音豆为例,其前身安克AI录音机主要在海外发售,主要卖点为录音及转录文字、以及GPT提供的内容总结,用户需缴纳每月15.99美元获取订阅服务,放到国内市场,卖点稍显不足,付费习惯也不通。

**飞书的合作方法是,在原有硬件产品基础上,打通与飞书生态的最后一公里。**将录音内容与飞书知识库产生联动,接入职场应用,同时购买后附赠6个月飞书免费会员,继承飞书AI账号权益额度。

与定位类似的钉钉AI录音卡片 DingTalk A1 相比,飞书则避开自研模式,通过与安克创新联动,最大程度缩短追赶时间。目前京东平台数据显示,安克AI录音豆销量已经破千。

豆包AI手机则是这套轻资产赋能战略在另一硬件入口的成功应用。豆包选择了一条最具性价比的路线来验证方案,挑选在手机市场中第二梯队的中兴通讯作为合作伙伴,如果合作华米OV等头部品牌,豆包手机助手很可能拿不到如此彻底的系统权限。此外,首批工程样机仅备货约3万台,以避开与华米OV等头部品牌过早展开正面竞争。

具体合作方式是,由中兴提供硬件研发与生产,豆包则掌控手机的灵魂,AI手机助手掌控手机操作系统权限,可实现跨APP交互、自动执行跨平台比价下单等复杂指令,这在手机圈引发巨震,中兴股价在短期内暴涨,而微信、淘宝、支付宝等APP则直接限制豆包手机助手的操作权限。

豆包AI眼镜同样沿用这一打法,豆包提供AI能力及自研空间算法芯片,龙旗科技只需提供底层UI开发以及整机生产,为豆包大模型披上眼镜的外壳。

对硬件厂商来说,与字节合作不会带来成本的过度增长,反而能让成熟产品迅速打破营销壁垒,借豆包AI的影响力拉动销量。

对字节跳动而言,避开阿里自研为主的模式,寻找成熟产品赋能,不仅节约成本,还能抵消时间差,在最短时间内验证技术路线,同时打开市场认知。一旦打法成熟,字节跳动有太多成熟赛道可以切入,教育硬件、智能玩具、具身智能等等,只要需要AI交互的消费级硬件,都有字节的用武之地。

03 大模型和硬件的周期错配

但快节奏+轻资产,并不意味着字节跳动找到了AI硬件的不败法宝。

事实上,AI硬件的主要痛点除了市场接受度外,还包含硬件与软件两大领域迭代周期的错配。

以手机行业为例,近期苹果确定放弃过去秋季发布新一代机型的模式,iPhone 18 Pro、Pro Max将于今年秋季发布,而iPhone 18、18e将于2027年秋季上市。对于手机用户来说,一年两发的节奏已经够快,不少消费者的换机频率,往往要在两年以上。

但对大模型赛道来说,这样的速度并不够快。2025年4月,豆包大模型发布1.5版本,两个月后发布1.6版本,到12月18日已经升级至1.8版本,目前迭代速度仍在加快。在性能上,豆包大模型的技术重心也早已转变,从1.5时期的侧重深度思考和视觉理解,转向1.8版本的多模态理解能力以及智能体能力。

**这意味着,AI硬件的体验代差,可能要比手机更大。**隔代手机或许在算力、续航、散热、屏幕、镜头等配置上有较大差异,但核心体验基本一致,AI硬件则未必如此。

当AI硬件以大模型能力为核心卖点时,就注定其"身躯"难以适应飞速发展的"大脑"。从研发流程看,AI硬件往往要在立项初期确定芯片等核心配置规格,并与软件做出算力、续航等匹配,旧设备难以追随云端模型性能需求将是普遍现象。

这也让AI硬件在设计思路上,尽力避免在端侧部署通用AI能力,而是尽力追求在特定场景上做出优化,端侧算力也更多用于感知与呈现,真正核心的推理任务则交给云端处理。

**这或是豆包AI眼镜、AI手机都限制测试版规模,先验证市场需求的原因所在。**当端侧算力注定无法与模型能力同步更新,企业的发售动作必须更谨慎。如果操之过急,隔代产品的体验代差将拉得过大。

对此,字节给出的答案是,先拿下下一代数据入口,让反哺软件的数据飞轮先跑起来再说。同时,无论是AI眼镜还是AI手机,字节跳动尝试通过端侧感知,云端推理的结构设计抵消差异,尽可能让任何一代产品都能使用最新模型能力。

随着CES上演百镜大战、千问APP全面接入agent能力以及消费服务,字节对下一个时代流量入口的焦虑正在加重。无论是火山云拿下春晚赞助,还是豆包全力进军AI硬件,都是用主动进攻的方式缓解焦虑,字节必须为大模型找到硬件支撑,守住用户规模优势。

相关推荐
NAGNIP10 小时前
一文搞懂深度学习中的通用逼近定理!
人工智能·算法·面试
冬奇Lab12 小时前
一天一个开源项目(第36篇):EverMemOS - 跨 LLM 与平台的长时记忆 OS,让 Agent 会记忆更会推理
人工智能·开源·资讯
冬奇Lab12 小时前
OpenClaw 源码深度解析(一):Gateway——为什么需要一个"中枢"
人工智能·开源·源码阅读
AngelPP15 小时前
OpenClaw 架构深度解析:如何把 AI 助手搬到你的个人设备上
人工智能
宅小年15 小时前
Claude Code 换成了Kimi K2.5后,我再也回不去了
人工智能·ai编程·claude
九狼16 小时前
Flutter URL Scheme 跨平台跳转
人工智能·flutter·github
ZFSS16 小时前
Kimi Chat Completion API 申请及使用
前端·人工智能
天翼云开发者社区17 小时前
春节复工福利就位!天翼云息壤2500万Tokens免费送,全品类大模型一键畅玩!
人工智能·算力服务·息壤
知识浅谈17 小时前
教你如何用 Gemini 将课本图片一键转为精美 PPT
人工智能
Ray Liang18 小时前
被低估的量化版模型,小身材也能干大事
人工智能·ai·ai助手·mindx