复旦肖仰华:大模型的数据科学!

2025年4月19日,第75期DataFunSummit:大模型时代数据科学的变与不变将在DataFun线上社区举办,数据科学主题峰会已经连续举办5届,是国内少数关注数据科学主题和数据科学从业者的专业会议之一。

本次会议继续由DataFun社区主办,计划邀请30+位重量级数据科学家同台分享交流,深入辩证的探讨大模型时代数据科学在技术与应用的"变与不变",立足不变夯实基础,顺应变化逐浪新潮流。

在4月19日上午的大模型时代数据科学的变与不变主论坛上,复旦大学教授、上海市数据科学重点实验室主任肖仰华将带来报告,主题为《大模型的数据科学》。

专家介绍:

肖仰华博士,复旦大学教授、博导,上海市数据科学重点实验室主任。长期从事大数据、认知智能研究。 荣获ICDE2024十年最有影响力论文奖、ACL2023杰出论文奖。发表 CCF-A 、B 类等论文 200 余篇。出版学术专著与教材三部。完成五十多项政府及人工智能头部企业研发项目。荣获包括华为、阿里、美团等机构授予的科研奖项二十多项。担任 Applied Intelligence 等多个国际期刊副主编或编委。

演讲提纲:

1.引言:大模型发展过程中数据所扮演的重要角色,以及大模型数据科学和大模型数据工程的定义,演讲结构概览

2.大模型的语料工程:大模型训练语料的选择标准、组织方式、分类体系、核心问题等,以及大模型课程学习优化策略

3.大模型的指令工程:大模型微调指令的分级体系、评价标准、优化方法等,以及大模型指令学习过程中的优化策略

4.多模态语料与指令:多模态大模型的训练数据特征,以及多模态数据集的评估方法、合成方式、分类体系等

5.大模型思维能力提升:大模型与人类思维过程的差异及大模型反思能力的实现、优化与评估

6.总结:数据是大模型发展过程中长期性、根本性、战略性问题,是引领大模型从"只知其然"的前"牛顿"时代走向"知其所以然"的"牛顿"时代的关键。

报名方式

大会议程

相关推荐
人工智能AI酱5 分钟前
【AI深究】逻辑回归(Logistic Regression)全网最详细全流程详解与案例(附大量Python代码演示)| 数学原理、案例流程、代码演示及结果解读 | 决策边界、正则化、优缺点及工程建议
人工智能·python·算法·机器学习·ai·逻辑回归·正则化
WangLanguager7 分钟前
逻辑回归(Logistic Regression)的详细介绍及Python代码示例
python·算法·逻辑回归
m0_518019489 分钟前
C++与机器学习框架
开发语言·c++·算法
wefly201711 分钟前
m3u8live.cn 在线M3U8播放器,免安装高效验流排错
前端·后端·python·音视频·前端开发工具
一段佳话^cyx14 分钟前
详解逻辑回归(Logistic Regression):原理、推导、实现与实战
大数据·算法·机器学习·逻辑回归
qq_4176950515 分钟前
C++中的代理模式高级应用
开发语言·c++·算法
xiaoye-duck39 分钟前
《算法题讲解指南:动态规划算法--路径问题》--5.不同路径,6.不同路径II
c++·算法·动态规划
C澒43 分钟前
微前端容器标准化 —— 公共能力篇:通用打印
前端·架构
ambition202421 小时前
最大子数组和算法全解析:从暴力枚举到动态规划优化
数据结构·c++·算法
德育处主任Pro1 小时前
前端元素转图片,dom-to-image-more入门教程
前端·javascript·vue.js