哈尔滨工业大学:大模型时代的具身智能

大家好,我是樱木。

机器人在工业领域,已经逐渐成熟。具身容易,智能难。

机器人-》智能机器人,需要自主能力,加上通用能力。

智能机器人-》人类,这个阶段就太有想象空间了。而最受关注的-类人机器人。

如何构建一个智能机器人

1、硬件:视觉信号、类人结构、位姿信号。

2、软件、算法:收集传感器采集的信息,对运动进行规划和决策。

3、传感器:执行工作。

什么是具身智能

物理身体的智能体与环境,通过环境交互,做出决策并行动。大致可以分为:感知、推理、执行。

在推理任务,大模型有非常显著的优势,相比于小模型推理能力又了显著提升。但是大模型构建出的具身智能也存在需要提升的地方:

推理速度慢、推理开销大。

生成结果不稳定。

复杂的 agent 难以维护、且时间开销会更大。

更多具身智能教程:具身智能教程

我是樱木,持续探索 AI 领域,主要分享最新的 AI 工具动态,评测,提效。

相关推荐
赞奇科技Xsuperzone7 分钟前
DGX Spark 实战解析:模型选择与效率优化全指南
大数据·人工智能·gpt·spark·nvidia
音视频牛哥13 分钟前
SmartMediaKit:如何让智能系统早人一步“跟上现实”的时间架构--从实时流媒体到系统智能的演进
人工智能·计算机视觉·音视频·音视频开发·具身智能·十五五规划具身智能·smartmediakit
喜欢吃豆14 分钟前
OpenAI Agent 工具全面开发者指南——从 RAG 到 Computer Use —— 深入解析全新 Responses API
人工智能·microsoft·自然语言处理·大模型
音视频牛哥1 小时前
超清≠清晰:视频系统里的分辨率陷阱与秩序真相
人工智能·机器学习·计算机视觉·音视频·大牛直播sdk·rtsp播放器rtmp播放器·smartmediakit
johnny2331 小时前
AI视频创作工具汇总:MoneyPrinterTurbo、KrillinAI、NarratoAI、ViMax
人工智能·音视频
Coovally AI模型快速验证2 小时前
当视觉语言模型接收到相互矛盾的信息时,它会相信哪个信号?
人工智能·深度学习·算法·机器学习·目标跟踪·语言模型
居7然2 小时前
Attention注意力机制:原理、实现与优化全解析
人工智能·深度学习·大模型·transformer·embedding
Scabbards_2 小时前
KGGEN: 用语言模型从纯文本中提取知识图
人工智能·语言模型·自然语言处理
LeonDL1682 小时前
【通用视觉框架】基于C#+Winform+OpencvSharp开发的视觉框架软件,全套源码,开箱即用
人工智能·c#·winform·opencvsharp·机器视觉软件框架·通用视觉框架·机器视觉框架
AI纪元故事会2 小时前
《目标检测全解析:从R-CNN到DETR,六大经典模型深度对比与实战指南》
人工智能·yolo·目标检测·r语言·cnn