技术栈
推理训练
百度智能云技术站
14 天前
具身智能
·
ai agent
·
百度百舸
·
推理训练
·
ai infra
Agent Native:重构 AI 云基础设施
本文整理自 2026 年 5 月 13 日 Create2026 百度 AI 开发者大会 - 技术与产品主论坛,百度集团副总裁侯震宇的主题演讲《Agent Native:重构 AI 云基础设施》。
TGITCIC
1 年前
人工智能
·
语言模型
·
自然语言处理
·
大模型训练
·
大模型推理
·
推理训练
解码未来:大语言模型训练与推理的双螺旋进化之路
训练始于海量数据的"营养摄入"。如同厨师需要收集世界各地的菜谱才能成为米其林主厨,谷歌BERT模型在预训练阶段吞下了800万网页文本、维基百科全集和30亿个英文句子。这些数据经过清洗、标注和分词处理,形成模型学习的"食材库"。某医疗AI公司为训练癌症诊断模型,收集了100万张标注CT影像,每张标注耗时2.3小时——这相当于让100个医生连续工作3年。数据质量决定模型的"食谱"丰富度,正如米其林餐厅对食材产地的苛求。
我是有底线的