以数据驱动工程机械智能化,网易灵动入选杭州国家语料库首批高质量数据集榜单

日前,2025数据要素发展大会成功举行,汇聚产学研力量,共探数据要素发展新路径。会上,杭州国家语料库首批高质量数据集建设先行先试"揭榜挂帅"名单 正式发布,网易灵动凭借"灵掘"工程机械数据集项目成功入选,在推动工程机械智能化领域数据资源共享与技术普惠方面获得了官方认可。

数据筑基:政策孵化产业创新实践

近年来,高新区(滨江)始终把数据作为发展新质生产力的关键要素,积极探索数据资源开发利用的路径,加快数字经济与实体经济融合发展。其中,首创的"三数一链+"数据流通安全框架体系已在国家层面完成互联互通验证,为全国数据要素流通提供了关键的"滨江方案"。同时,高新区(滨江)制定出台《关于促进数据产业高质量发展的实施意见》、发布《数商企业评定标准》,加快培育数据要素市场主体、鼓励企业通过"三数一链"体系参与数据要素市场化改革、推动数据基础设施建设,助力实现数商企业精准画像与分级培育。

高质量语料是人工智能发展的关键。此次杭州国家语料库首批高质量数据集建设先行先试"揭榜挂帅"名单发布,旨在为大模型训练提供易获取、高质量、规模化、低成本的语料资源,入选项目代表着各行业数据集建设的标杆水平。本次入选的**"灵掘"是全球首个"端到端"工程机械具身智能模型**,通过多模态数据驱动的自主学习技术,破解传统方案在泛化能力不足和高度依赖定制化开发等方面的难题。此前,网易灵动已开放相关场景数据集并发布技术方案,推动行业技术进步与共享。

由虚向实:人机协作破局数据采集难题

"物理世界数据采集"难题 是具身智能的"核心瓶颈"之一。网易灵动作为网易旗下工程机械智能化品牌,依托网易伏羲在游戏领域多年的技术积累,一方面通过"网易有灵人机协作平台"链接游戏中的虚拟交互与现实中的物理任务 ,既缓解用工压力,又以人机协作突破单一AI能力不均的瓶颈;另一方面,通过人机协作的模式实现"Human-in-the-Loop"采集数据,不仅沉淀出高质量的操作数据,还解决了传统方法数据获取成本高、场景覆盖有限的难题。

在此基础上,网易灵动发布了全球首个面向工程机械行业的具身智能训练框架------"机械智心" 。该框架突破单一学习模式局限,通过强化学习、专家数据学习、视频数据学习三阶段深度融合,让模型从"会操作"到"懂操作"。

基于这一训练框架,"灵掘"具身智能模型依托马尔科夫(MDP)模型构建端到端决策架构,采用视频生成预训练模型+策略扩散模型 技术路线,在百万级数据支撑下,累计训练100余小时,最终模型从一开始不知如何下挖,到学会挖满一斗,进而完成一整套装卸与装车作业。这是数据规模定律(Data Scaling Laws)首次在工程机械智能化领域得到验证,为后续工程机械智能化的发展指明了方向------持续获取更多数据。为此,网易灵动对外公布了数据集开放计划,推动行业技术普惠:

  • TB级的挖机作业视频数据集,涵盖了不同品牌的挖机、不同光照条件(白天、黑夜)以及不同采集平台的数据。
  • 百万级挖机师傅的作业示范轨迹数据集,其中涵盖激光数据、视觉图像以及挖机的关节角度与速度。

*数据集开放地址:

除"灵掘"模型,针对粉尘大、环境恶劣的散料场景,通过智能化改造与无人驾驶技术,网易灵动推出全球首款面向全域场景的具身智能无人装载机"灵载" 。目前,"灵载"无人装载机已突破传统封闭场景限制,实现从标准化搅拌站到开放型港口、堆场、电厂、化工厂、沥青搅拌站、农业等多场景的规模化应用

系统可自主适应复杂动态环境,在保障作业安全的前提下,大幅提升港口散料运输、电厂燃煤输送、堆场物料整理等场景的运营效率。根据已运行的示范项目数据统计,"灵载"无人装载机已带来显著的量化价值:作业效率提升30%,综合能耗降低15%,人力成本下降70%,连续安全作业超50000小时

数据驱动,发展新质生产力

此次入选,是对网易灵动以数据驱动破解工程机械智能化瓶颈的肯定。从游戏AI到工程机械,从数据采集到模型进化,具身智能正让机器从被动工具转变为主动协作伙伴,而开放共享的数据集则为行业共研按下"加速键"。此前开放的TB级工程机械视频与百万级轨迹数据集,不仅为全球学术界与工业界提供宝贵的研究资源,更是以实际行动响应"汇聚高质量语料"的号召,参与构建开放协作的数据生态。未来,网易灵动将继续以数据驱动为核心,将技术实践扎根于真实的产业土壤,携手各行业伙伴共同推动数据要素从资源形态向生产力形态的深刻转化,为发展新质生产力注入新动能。

相关推荐
牧子川5 小时前
009-Transformer-Architecture
人工智能·深度学习·transformer
covco5 小时前
矩阵管理系统指南:拆解星链引擎的架构设计与全链路落地实践
大数据·人工智能·矩阵
沪漂阿龙5 小时前
AI大模型面试题:支持向量机是什么?间隔最大化、软间隔、核函数、LinearSVC 全面拆解
人工智能·算法·支持向量机
lifewange5 小时前
AI编写测试用例工具介绍
人工智能·测试用例
陕西字符5 小时前
2026 西安 豆包获客优化技术深度解析:企来客科技 AI 全域获客系统测评
大数据·人工智能
掘金安东尼6 小时前
GGUF、GPTQ、AWQ、EXL2、MLX、VMLX...运行大模型,为什么会有这么多格式?
人工智能
新知图书6 小时前
市场分析报告自动化生成(使用千问)
人工智能·ai助手·千问·高效办公
无心水6 小时前
【Hermes:安全、权限与生产环境】38、Hermes Agent 安全四层纵深:最小权限原则从理论到落地的完全指南
人工智能·安全·mcp协议·openclaw·养龙虾·hermes·honcho
旦莫6 小时前
AI驱动的纯视觉自动化测试:知识库里应该积累什么知识内容
人工智能·python·测试开发·pytest·ai测试
dfsj660116 小时前
第四章:深度学习革命
人工智能·深度学习