
"白虎"数据集由国家地方共建人形机器人创新中心牵头打造,作为全球首个规模突破百万量级的异构机器人数据集,其数据源自真实应用场景,全面覆盖多种全尺寸人形机器人、类人形轮式机器人以及机械臂等异构平台,并经过严格的质量控制与校验。上线后备受行业认可,在AtomGit单平台的累计下载量已达 100 万 。

作为一个综合性的机器人操作数据集,白虎数据集针对多个机器人平台系统构建,目前已正式开源四款主流机器人本体和两类典型末端类型,合计覆盖30余类高频任务类型,共计10万余条高质量任务数据。
此外,白虎数据集实现了多场景、多任务 的全面覆盖,真实采集涉及工业制造、家居家政、餐饮服务、商超药店、通用抓取放置等 多种场景,完成了超过380个 任务类型,涉及500多种 真实物品,涵盖抓取、插入、旋转、放置等100多种原子技能,基本覆盖了约90%的日常生活的使用和工业操作需求,显著提升了模型在现实复杂场景中的泛化能力。

基于白虎数据集的多场景多任务操作应用
作为白虎数据集的重要延伸,白虎-VTouch视触觉多模态数据集进一步扩大了其行业影响力,精准补齐了具身智能Scaling Law中 "触觉与接触" 的关键数据维度,是全球首个跨本体视触觉多模态数据集。白虎-VTouch数据集自1月26号 正式官宣开源以来,热度持续攀升,单日最高下载量超4万次 ,在不足1个月的时间里,在AtomGit平台累计下载量已突破68万次,凭借突出的技术价值与开源优势,迅速获得业界高度认可。该数据集的推出,为机器人精细操作、力控部署等核心场景提供了稀缺的视触觉数据支撑,加速推动具身智能从 "能看会动" 向 "精准触控、智能交互" 升级,重塑视触觉感知与跨本体泛化技术的研发路径。

白虎-VTouch数据集在AtomGit平台的下载数据
未来,白虎数据集将持续扩容升级,开源全量规模将突破百万条任务数据,同时不断引入更多机器人类型、多元末端执行形式、丰富真实场景任务内容,并新增多模态传感输入维度,进一步完善通用具身智能系统训练的数据基座。依托其庞大的下载体量与广泛的行业认可度,白虎数据集将持续带动人形机器人技术从实验室走向规模化产业落地,助力OpenLoong开源社区巩固人形机器人领域开源生态核心地位,以数据之力推动具身智能时代加速到来。