蚂蚁数科AI数据产业基地正式投产,携手苏州推进AI产业落地

近日,蚂蚁数科AI数据产业基地在太仓智汇谷·科技创新园正式投产。该基地作为苏州市首个AI数据产业基地,旨在通过跨行业人才与前沿技术,为长三角制造业、金融、医疗等领域的大模型落地提供场景化、高质量的训练数据支撑。

数据被视为AI学习的核心教材。然而,AI在工业等复杂场景落地时,常面临行业知识匮乏、高质量数据稀缺等瓶颈,急需专业人才参与建设。专业的AI数据标注师,被誉为"AI教官",他们通过精确标注和修正,确保训练数据准确、无偏见,以此提升模型输出的安全性与可靠性,并持续"教导"AI理解语义、更通人情。

赵秋燕是某财经大学金融学本科毕业,曾从事会计工作,擅长纠正AI回答的金融问题。学法律的严冯娜,主要工作是标注大模型输出文字中涉及的"红线"问题,教AI"什么能说,什么不能说"。标注师李宁曾经是个美术老师,他需要面对大量图片数据,标注其中的"内容风险"。医学、外语、旅游等领域的专业人才也正加入各垂类模型的数据标注工作。

"蚂蚁数科AI标注师队伍的平均学历在本科以上,太仓政府在园区建设、人才招募、生态企业入驻等方面提供了强力支持。"蚂蚁数科AI科技事业部总经理张凯介绍,蚂蚁数科已与江苏多所高校开展产教融合、孵化AI实战人才。按计划,基地未来将扩展至300人规模。

技术层面,蚂蚁数科自研的AI数据标注平台可智能推荐标注内容、自动补全标签,结合自动化质检与人工抽检双重保障数据质量。当前其标注服务已覆盖金融风控、内容审核、自动驾驶、智能客服等数十个场景,为多领域大模型产业化提供可靠的数据基石。

相关推荐
@小匠35 分钟前
Read Frog:一款开源的 AI 驱动浏览器语言学习扩展
人工智能·学习
网教盟人才服务平台4 小时前
“方班预备班盾立方人才培养计划”正式启动!
大数据·人工智能
芯智工坊4 小时前
第15章 Mosquitto生产环境部署实践
人工智能·mqtt·开源
菜菜艾4 小时前
基于llama.cpp部署私有大模型
linux·运维·服务器·人工智能·ai·云计算·ai编程
TDengine (老段)4 小时前
TDengine IDMP 可视化 —— 分享
大数据·数据库·人工智能·时序数据库·tdengine·涛思数据·时序数据
小真zzz4 小时前
搜极星:第三方多平台中立GEO洞察专家全面解析
人工智能·搜索引擎·seo·geo·中立·第三方平台
GreenTea5 小时前
从 Claw-Code 看 AI 驱动的大型项目开发:2 人 + 10 个自治 Agent 如何产出 48K 行 Rust 代码
前端·人工智能·后端
火山引擎开发者社区5 小时前
秒级创建实例,火山引擎 Milvus Serverless 让 AI Agent 开发更快更省
人工智能
冬奇Lab5 小时前
一天一个开源项目(第72篇):everything-claude-code - 最系统化的 Claude Code 增强框架
人工智能·开源·资讯