大语言模型打卡学习DAY1

学习目标:

  • 语言模型的发展历程
  • 大模型的技术基础

学习内容:

1. 语言模型的发展历程

复制代码
   `语言模型通常是指能够建模自然语言文本生成概率的模型,从语言建模到任务求解,这是科学思维的一次重要跃升。`

2. 大语言模型技术基础

定义:通常是指具有超大规模参数的预训练语言模型
架构: 主要为Transformer架构
训练:预训练(base model)、后训练(instruct model)


2.1 大语言模型与训练(Pre-training)

定义:使用与下游任务无关的大规模数据进行模型参数的初始训练

2.2 大语言模型后训练(Post-Training)



相关推荐
知行力几秒前
【GitHub每日速递 251011】无需注册!本地开源AI应用构建器Dyad,跨平台速下载!
人工智能·开源·github
jie*几秒前
小杰深度学习(ten)——视觉-经典神经网络——LetNet
人工智能·python·深度学习·神经网络·计算机网络·数据分析
xwz小王子3 分钟前
Nature Machine Intelligence丨多模态大型语言模型中的视觉认知
人工智能·语言模型·自然语言处理
冰糖猕猴桃11 分钟前
【AI】深入 LangChain 生态:核心包架构解析
人工智能·ai·架构·langchain
今天只学一颗糖14 分钟前
Linux学习笔记--查询_唤醒方式读取输入数据
笔记·学习
松果财经23 分钟前
千亿级赛道,Robobus 赛道中标新加坡自动驾驶巴士项目的“确定性机会”
人工智能·机器学习·自动驾驶
TMT星球24 分钟前
滴滴自动驾驶张博:坚持负责任的科技创新,积极探索新型就业空间
人工智能·科技·自动驾驶
Blossom.11825 分钟前
用一颗MCU跑通7B大模型:RISC-V+SRAM极致量化实战
人工智能·python·单片机·嵌入式硬件·opencv·机器学习·risc-v
mit6.82428 分钟前
[GazeTracking] 摄像头交互与显示 | OpenCV
人工智能·opencv·交互
GIS学姐嘉欣37 分钟前
【智慧城市】2025年中国地质大学(武汉)暑期实训优秀作品(5):智慧矿产
学习·gis·智慧城市·webgis