大语言模型打卡学习DAY1

学习目标:

  • 语言模型的发展历程
  • 大模型的技术基础

学习内容:

1. 语言模型的发展历程

复制代码
   `语言模型通常是指能够建模自然语言文本生成概率的模型,从语言建模到任务求解,这是科学思维的一次重要跃升。`

2. 大语言模型技术基础

定义:通常是指具有超大规模参数的预训练语言模型
架构: 主要为Transformer架构
训练:预训练(base model)、后训练(instruct model)


2.1 大语言模型与训练(Pre-training)

定义:使用与下游任务无关的大规模数据进行模型参数的初始训练

2.2 大语言模型后训练(Post-Training)



相关推荐
不加辣椒1 小时前
第12章 工具调用与 Agent 提示工程
人工智能
用户1693176172661 小时前
前端给AI消息做日期分组与时间线
人工智能
i晟1 小时前
Claude Code Harness 深度拆解:从你敲回车到模型回复,中间发生了什么
人工智能
用户252736278142 小时前
【踩坑复盘】我在本地跑 RAG 知识库时踩了 5 个大坑,吐血整理避坑指南
人工智能
大模型真好玩2 小时前
LangChain DeepAgents 速通指南(九)—— 生产级智能体框架 DeepAgents Code 源码导读
人工智能·langchain·agent
用户018349301695 小时前
用Zustand管理AI多会话状态
人工智能
武子康7 小时前
调查研究-198 Agent 到底该记住什么?读懂《What Must Generalist Agents Remember?》
人工智能·openai·agent
aqi007 小时前
15天学会AI应用开发(九)利用Chroma持久化向量数据
人工智能·python·大模型·ai编程·ai应用
武子康9 小时前
调查研究-197 FAISS vs Elasticsearch 全面对比:从向量检索、全文搜索到 RAG 选型指南
人工智能·elasticsearch·agent