DataWhale 大语言模型 - 语言模型发展历程

大语言模型 LLMBook

项目背景

本课程围绕中国人民大学高瓴人工智能学院赵鑫教授团队出品的《大语言模型》书籍展开,覆盖大语言模型训练与使用的全流程,从预训练到微调与对齐,从使用技术到评测应用,帮助学员全面掌握大语言模型的核心技术。并且,课程内容基于大量的代码实战与讲解,通过实际项目与案例,学员能将理论知识应用于真实场景,提升解决实际问题的能力。

作者:赵鑫李军毅周昆唐天一文继荣

项目受众

本课程面向希望深入掌握大模型技术的 AI 从业者,帮助其训练、优化和应用大模型以解决实际问题。同时,课程适合对人工智能前沿技术感兴趣的学生与研究人员,为其学术研究或职业发展奠定基础。此外,产品经理、技术管理者与创业者也可通过本课程了解大模型的潜力与应用,推动产品创新并优化技术战略。

学员需要具备一定的Python编程能力,熟悉PyTorch等经典深度学习框架,并具有一定的深度学习基础。

课程地址:https://www.datawhale.cn/learn/summary/107

赵鑫教授团队:http://aibox.ruc.edu.cn/

B站教学视频:《大语言模型》1.1 语言模型发展历程_哔哩哔哩_bilibili

相关推荐
mengyoufengyu4 分钟前
DeepSeek11-Ollama + Open WebUI 搭建本地 RAG 知识库全流程指南
人工智能·深度学习·deepseek
Tianyanxiao5 分钟前
华为×小鹏战略合作:破局智能驾驶深水区的商业逻辑深度解析
大数据·人工智能·经验分享·华为·金融·数据分析
rit843249932 分钟前
基于BP神经网络的语音特征信号分类
人工智能·神经网络·分类
一点.点37 分钟前
AlphaDrive:通过强化学习和推理释放自动驾驶中 VLM 的力量
人工智能·机器学习·自动驾驶
科技小E1 小时前
口罩佩戴检测算法AI智能分析网关V4工厂/工业等多场景守护公共卫生安全
网络·人工智能
说私域1 小时前
基于定制开发开源AI智能名片S2B2C商城小程序的首屏组件优化策略研究
人工智能·小程序·开源·零售
vlln1 小时前
2025年与2030年AI及AI智能体 (Agent) 市场份额分析报告
人工智能·深度学习·神经网络·ai
栗克1 小时前
Halcon 图像预处理②
人工智能·计算机视觉·halcon
互联网全栈架构2 小时前
遨游Spring AI:第一盘菜Hello World
java·人工智能·后端·spring
m0_465215792 小时前
大语言模型解析
人工智能·语言模型·自然语言处理