复旦肖仰华:大模型的数据科学!

2025年4月19日,第75期DataFunSummit:大模型时代数据科学的变与不变将在DataFun线上社区举办,数据科学主题峰会已经连续举办5届,是国内少数关注数据科学主题和数据科学从业者的专业会议之一。

本次会议继续由DataFun社区主办,计划邀请30+位重量级数据科学家同台分享交流,深入辩证的探讨大模型时代数据科学在技术与应用的"变与不变",立足不变夯实基础,顺应变化逐浪新潮流。

在4月19日上午的大模型时代数据科学的变与不变主论坛上,复旦大学教授、上海市数据科学重点实验室主任肖仰华将带来报告,主题为《大模型的数据科学》。

专家介绍:

肖仰华博士,复旦大学教授、博导,上海市数据科学重点实验室主任。长期从事大数据、认知智能研究。 荣获ICDE2024十年最有影响力论文奖、ACL2023杰出论文奖。发表 CCF-A 、B 类等论文 200 余篇。出版学术专著与教材三部。完成五十多项政府及人工智能头部企业研发项目。荣获包括华为、阿里、美团等机构授予的科研奖项二十多项。担任 Applied Intelligence 等多个国际期刊副主编或编委。

演讲提纲:

1.引言:大模型发展过程中数据所扮演的重要角色,以及大模型数据科学和大模型数据工程的定义,演讲结构概览

2.大模型的语料工程:大模型训练语料的选择标准、组织方式、分类体系、核心问题等,以及大模型课程学习优化策略

3.大模型的指令工程:大模型微调指令的分级体系、评价标准、优化方法等,以及大模型指令学习过程中的优化策略

4.多模态语料与指令:多模态大模型的训练数据特征,以及多模态数据集的评估方法、合成方式、分类体系等

5.大模型思维能力提升:大模型与人类思维过程的差异及大模型反思能力的实现、优化与评估

6.总结:数据是大模型发展过程中长期性、根本性、战略性问题,是引领大模型从"只知其然"的前"牛顿"时代走向"知其所以然"的"牛顿"时代的关键。

报名方式

大会议程

相关推荐
kooboo china.32 分钟前
Tailwind css实战,基于Kooboo构建AI对话框页面(二)
前端·css
数据与人工智能律师2 小时前
加密货币投资亏损后,能否以“欺诈”或“不当销售”索赔?
大数据·网络·算法·云计算·区块链
努力学习的小廉2 小时前
我爱学算法之—— 二分查找(下)
算法
AdSet聚合广告2 小时前
APP广告变现,开发者如何判断对接的广告SDK安全合规?
大数据·后端·算法·安全·uni-app
不二狗2 小时前
每日算法 -【Swift 算法】实现回文数判断!
开发语言·算法·swift
yuanmenglxb20044 小时前
react基础技术栈
前端·javascript·react.js
野犬寒鸦4 小时前
Redis核心数据结构操作指南:字符串、哈希、列表详解
数据结构·数据库·redis·后端·缓存·哈希算法
无敌小肥0074 小时前
Springboot 整合 WebSocket 实现聊天室功能
spring boot·后端·websocket
Magnum Lehar5 小时前
vulkan游戏引擎vulkan部分的fence实现
java·前端·游戏引擎
梁下轻语的秋缘5 小时前
Python人工智能算法 模拟退火算法求解01背包问题:从理论到实践的完整攻略
人工智能·python·算法·数学建模·模拟退火算法