大语言模型打卡学习DAY1

学习目标:

  • 语言模型的发展历程
  • 大模型的技术基础

学习内容:

1. 语言模型的发展历程

复制代码
   `语言模型通常是指能够建模自然语言文本生成概率的模型,从语言建模到任务求解,这是科学思维的一次重要跃升。`

2. 大语言模型技术基础

定义:通常是指具有超大规模参数的预训练语言模型
架构: 主要为Transformer架构
训练:预训练(base model)、后训练(instruct model)


2.1 大语言模型与训练(Pre-training)

定义:使用与下游任务无关的大规模数据进行模型参数的初始训练

2.2 大语言模型后训练(Post-Training)



相关推荐
我们从未走散21 分钟前
设计模式学习笔记-----单例模式
java·笔记·学习·单例模式·设计模式
居7然38 分钟前
解锁AI大模型:Prompt工程全面解析
人工智能·prompt·提示词
思通数据5 小时前
AI视频监控:重构安防行业智能化新生态
人工智能·安全·目标检测·机器学习·计算机视觉·重构·数据挖掘
宇寒风暖5 小时前
@(AJAX)
前端·javascript·笔记·学习·ajax
萤丰信息5 小时前
智慧工地从工具叠加到全要素重构的核心引擎
java·大数据·人工智能·重构·智慧城市·智慧工地
riveting5 小时前
明远智睿SSD2351:以技术突破重构嵌入式市场格局
大数据·人工智能·重构·边缘计算·嵌入式开发·智能交通
计算机sci论文精选6 小时前
CVPR2025敲门砖丨机器人结合多模态+时空Transformer直冲高分,让你的论文不再灌水
人工智能·科技·深度学习·机器人·transformer·cvpr
XIAO·宝6 小时前
机器学习----绪论
人工智能·机器学习
41号学员6 小时前
机器学习绪论
人工智能·机器学习
华清远见成都中心6 小时前
基于深度学习的异常检测算法在时间序列数据中的应用
人工智能·深度学习·算法