信息化时代,数据驱动决策的重要性日益凸显。通过利用数据可以深入了解市场需求、客户行为、竞争态势等关键信息,从而制定更为有效的战略和决策。围绕推动数据要素产业发展,近日,深圳数据交易所(以下简称"深数所")主办的 2023 中国(深圳)数据要素产业创新大会平行活动"数据要素赋能人工智能产业创新专题活动"圆满落幕。上海和今信息科技有限公司(简称"和鲸科技")受邀出席,并参与发布两个"首次亮相",赋能人工智能产业创新。
图:活动现场
论坛上,中国信息通信研究院、深数所、上海和今信息科技有限公司和深圳市华傲数据技术有限公司发出联合提议:开放算料联盟以粤港澳大湾区特色为主题,围绕数据治理、训练数据(含合成数据)、数据标注、数据质量评估、模型质量评估等方向开展参编单位征集、标准化研究工作。
作为开放算料联盟的副秘书长单位,上海和今信息科技有限公司(下简称"和鲸科技")的创始人、CEO 范向伟代表开放算料联盟于大会上首次发布"开放算料联盟高质量数据集"。该数据集的贡献者包括上海和今信息科技有限公司、深圳市华傲数据技术有限公司、粤港澳大湾区数字经济研究院(福田)、伦敦证券交易所等十余家企业,涵盖金融、政务、科研、小语种、自动驾驶等不同领域,总规模超过 1000T ,涉及文本、图像、语音及多模态数据,有望打破训练数据瓶颈,为通用大模型和行业大模型训练提供有力保障。
图:范向伟正在介绍数据集贡献企业
范向伟表示,高质量垂直行业数据集加上数据开发者生态可构成规模化的生产数据产品,对人工智能产业发展有着多维度支撑作用。例如,数据集的上线将促进多重优质资源的交互与共享,可支持不同科研团队利用同一份数据分别开展研究;数据集发布的门户页将同时聚集数据贡献者与使用者形成开发者专区,为知识的流动和技术的创新提供集中平台。
图:开放算料联盟高质量数据集门户页
论坛上,深数所更协同华南理工大学、上海和今信息科技有限公司等 4 家科技企业,推出了全国首个场内数据要素开发者培训课程 ,以培养更多的数据开发者,为数据要素市场的繁荣和发展提供人才保障,范向伟与发起单位共同开启课程发布仪式。据悉,该课程涵盖数据采集、处理、建模、应用等多个方面,通过系统性的学习和实践,开发者们将能够提升数据要素的开发和应用能力,进一步促进数据要素的流通和高效智慧利用。
图:数据开发者计划发起单位共同开启课程发布仪式(左3为和鲸科技CEO范向伟)
数据要素的开放共享是引领行业前行的关键动力,培养更多优秀的数据开发者更是推动产业升级不可或缺的中坚力量。此次活动,和鲸科技不仅是参与者,更是共筑者。
在此人工智能产业新纪元开启的转折点,和鲸将持续致力于打破技术壁垒,推动数据要素的流通和产业应用,构建更开放的开发者生态,为科技创新与产业进步贡献力量。