和鲸科技携手深圳数据交易所,“数据+数据开发者生态”赋能人工智能产业发展

信息化时代,数据驱动决策的重要性日益凸显。通过利用数据可以深入了解市场需求、客户行为、竞争态势等关键信息,从而制定更为有效的战略和决策。围绕推动数据要素产业发展,近日,深圳数据交易所(以下简称"深数所")主办的 2023 中国(深圳)数据要素产业创新大会平行活动"数据要素赋能人工智能产业创新专题活动"圆满落幕。上海和今信息科技有限公司(简称"和鲸科技")受邀出席,并参与发布两个"首次亮相",赋能人工智能产业创新。

图:活动现场

论坛上,中国信息通信研究院、深数所、上海和今信息科技有限公司和深圳市华傲数据技术有限公司发出联合提议:开放算料联盟以粤港澳大湾区特色为主题,围绕数据治理、训练数据(含合成数据)、数据标注、数据质量评估、模型质量评估等方向开展参编单位征集、标准化研究工作。

作为开放算料联盟的副秘书长单位,上海和今信息科技有限公司(下简称"和鲸科技")的创始人、CEO 范向伟代表开放算料联盟于大会上首次发布"开放算料联盟高质量数据集"。该数据集的贡献者包括上海和今信息科技有限公司、深圳市华傲数据技术有限公司、粤港澳大湾区数字经济研究院(福田)、伦敦证券交易所等十余家企业,涵盖金融、政务、科研、小语种、自动驾驶等不同领域,总规模超过 1000T ,涉及文本、图像、语音及多模态数据,有望打破训练数据瓶颈,为通用大模型和行业大模型训练提供有力保障。

图:范向伟正在介绍数据集贡献企业

范向伟表示,高质量垂直行业数据集加上数据开发者生态可构成规模化的生产数据产品,对人工智能产业发展有着多维度支撑作用。例如,数据集的上线将促进多重优质资源的交互与共享,可支持不同科研团队利用同一份数据分别开展研究;数据集发布的门户页将同时聚集数据贡献者与使用者形成开发者专区,为知识的流动和技术的创新提供集中平台。

图:开放算料联盟高质量数据集门户页

论坛上,深数所更协同华南理工大学、上海和今信息科技有限公司等 4 家科技企业,推出了全国首个场内数据要素开发者培训课程以培养更多的数据开发者,为数据要素市场的繁荣和发展提供人才保障,范向伟与发起单位共同开启课程发布仪式。据悉,该课程涵盖数据采集、处理、建模、应用等多个方面,通过系统性的学习和实践,开发者们将能够提升数据要素的开发和应用能力,进一步促进数据要素的流通和高效智慧利用。

图:数据开发者计划发起单位共同开启课程发布仪式(左3为和鲸科技CEO范向伟)

数据要素的开放共享是引领行业前行的关键动力,培养更多优秀的数据开发者更是推动产业升级不可或缺的中坚力量。此次活动,和鲸科技不仅是参与者,更是共筑者。

在此人工智能产业新纪元开启的转折点,和鲸将持续致力于打破技术壁垒,推动数据要素的流通和产业应用,构建更开放的开发者生态,为科技创新与产业进步贡献力量。

相关推荐
galileo201619 分钟前
LLM与金融
人工智能
DREAM依旧35 分钟前
隐马尔科夫模型|前向算法|Viterbi 算法
人工智能
GocNeverGiveUp1 小时前
机器学习2-NumPy
人工智能·机器学习·numpy
B站计算机毕业设计超人2 小时前
计算机毕业设计PySpark+Hadoop中国城市交通分析与预测 Python交通预测 Python交通可视化 客流量预测 交通大数据 机器学习 深度学习
大数据·人工智能·爬虫·python·机器学习·课程设计·数据可视化
学术头条2 小时前
清华、智谱团队:探索 RLHF 的 scaling laws
人工智能·深度学习·算法·机器学习·语言模型·计算语言学
18号房客2 小时前
一个简单的机器学习实战例程,使用Scikit-Learn库来完成一个常见的分类任务——**鸢尾花数据集(Iris Dataset)**的分类
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理·sklearn
feifeikon2 小时前
机器学习DAY3 : 线性回归与最小二乘法与sklearn实现 (线性回归完)
人工智能·机器学习·线性回归
游客5202 小时前
opencv中的常用的100个API
图像处理·人工智能·python·opencv·计算机视觉
古希腊掌管学习的神2 小时前
[机器学习]sklearn入门指南(2)
人工智能·机器学习·sklearn
凡人的AI工具箱2 小时前
每天40分玩转Django:Django国际化
数据库·人工智能·后端·python·django·sqlite