DeepSeek正重构人形机器人和具身大模型赛道!

中国人工智能公司DeepSeek(深度求索)以"低成本、高效率、强开放"的研发范式横空出世,火遍并震撼全球科技圈;DeepSeek展现出来的核心竞争力,除了低成本及推理能力,更重要的是开源模型能力追赶上了最新的闭源模型;而对具身智能领域影响最大的当属于其开源大模型DeepSeek-R1。

2024年1月20日,公司发布全球首个完全通过强化学习训练的专注于推理任务的高性能语言模型DeepSeek-R1,在数学、代码、自然语言推理等任务上,性能比肩OpenAI于2024年12月发布的ol正式版模型为具身智能领域带来了新的技术思路和发展机遇,并有望重构行业的竞争格局。

据光大证券分析师梳理,基于开源DeepSeek-R1,人形机器人有望从两个方向受益:

  • 从单模态到多模态,有望实现更好的"大脑";目前,在主流的具身智能大模型中,普遍采用VLM(视觉语言大模型)作为骨干,承担"task planning"的任务,即所谓的"大脑";目前Deepseek团队也开发了系列大模型,如DeepSeek-VL2,大型混合专家(MoE)视觉-语言模型系列,具备较好的视觉语义对话能力;

  • 开源的模型提升"大脑"水平,降低门槛,推动更多力量向"小脑"集中;以往的闭源模型使得很多具身智能团队需从头开发"大脑"和"小脑";整体来看,由于训练数据的缺失,"大脑"的"task planning"能力相对成熟,而小脑的"motion planning"则较弱;Deepseek团队的开源策略,有望在"大脑"层面降低行业门槛,推动更多的力量向更底层的运控集中;

目前人形机器人第一股[优必选科技]已官宣:公司正在验证DeepSeek技术在人形机器人应用场景中的有效性;国内人形机器人企业[宇树科技]也被传已与DeepSeek达成深度合作;以及目前终止与OpenAI合作的人形机器人独角兽公司[Figure AI]被传极有可能是基于 DeepSeek-R1 开发自家机器人大模型。

小编已经多次提到:人工智能和大模型技术突破性发展催生了本身具身智能浪潮,大模型决定了人形机器人泛化能力,是现阶段人形机器人商业化核心壁垒

而随着DeepSeek-R1开源大模型发布(科技大厂OpenAI、英伟达、华为、百度、科大讯飞等主流大模型都是闭源),人形机器人初创公司可以基于其模型进行二次开发,构建自己的技术闭环,真正掌握核心技术的主动权,打破科技大厂垄断"大脑"层面格局。

值的注意的是随着DeepSeek的开源模式,还引起了具身智能大模型赛道开源风。

以上都是人形机器人本体公司,那么在具身智能大模型公司,谁将成为第一个吃DeepSeek开源红利的公司?

小编视角:拥有国内"最强、科学家密度最高"具身智能大模型初创公司【北京灵初智能科技有限公司】有望成为第一家吃到DeepSeek开源红利的机器人大脑公司。

2025年2月6日,基于自研全模态框架Align-Anything,【北京大学 】联合【香港科技大学】团队将纯文本模态的Deepseek R1系列模型拓展至了图文模态,推出多模态版DeepSeek-R1---Align-DS-V,它在部分视觉理解表现评测集上超越GPT-4o。

值的注意的是,联合研究团队中的北京大学对齐团队的指导老师为北京大学人工智能研究院助理教授杨耀东,同时担任[北大-灵初智能具身灵巧操作联合实验室]首席科学家;目前在Align-DS-V的基础上,北大-灵初智能联合实验室已经着手在VLA(Vision Language Action Model,视觉语言动作模型)领域方面做更深度的探索。

接下来小编将详细介绍,这家号称拥有国内"科学家密度最高"具身智能创始团队的具身智能大模型初创公司【灵初智能】。

... ... ...

本文仅展示极少部分内 容,接下来,小编将从多方面梳理DeepSeek-R1对具身智能(人形机器人本体和具身智能大模型)赛道影响,并详细分析DeepSeek公司创新点和技术优势,以及DeepSeek-R1对具身智能产生重大影响的原因。****

... ... ...

本文内容仅展示一部分,更多详细解读,加入知识星球"机器人头条"查看完整版文章: [原创]浅谈开源大模型DeepSeek-R1 对具身智能赛道影响 并深度 了解"具身智能&人形机器人"赛道

相关推荐
知来者逆9 小时前
视觉语言模型应用开发——Qwen 2.5 VL模型视频理解与定位能力深度解析及实践指南
人工智能·语言模型·自然语言处理·音视频·视觉语言模型·qwen 2.5 vl
IT_陈寒9 小时前
Java性能优化:10个让你的Spring Boot应用提速300%的隐藏技巧
前端·人工智能·后端
Android出海9 小时前
Android 15重磅升级:16KB内存页机制详解与适配指南
android·人工智能·新媒体运营·产品运营·内容运营
cyyt10 小时前
深度学习周报(9.1~9.7)
人工智能·深度学习
聚客AI10 小时前
🌸万字解析:大规模语言模型(LLM)推理中的Prefill与Decode分离方案
人工智能·llm·掘金·日新计划
max50060010 小时前
图像处理:实现多图点重叠效果
开发语言·图像处理·人工智能·python·深度学习·音视频
赵孝正10 小时前
GitLab 分支管理与 Push 问题全解析
大数据·elasticsearch·gitlab
麦麦麦造10 小时前
国外网友的3个步骤,实现用Prompt来写Prompt!超简单!
人工智能
闲看云起10 小时前
从BERT到T5:为什么说T5是NLP的“大一统者”?
人工智能·语言模型·transformer
嘉禾望岗50310 小时前
Yarn介绍与HA搭建
大数据·hadoop·yarn