大语言模型打卡学习DAY1

Brave heart2025-03-14 16:33

学习目标：

语言模型的发展历程
大模型的技术基础

学习内容：

1. 语言模型的发展历程

复制代码

   `语言模型通常是指能够建模自然语言文本生成概率的模型，从语言建模到任务求解，这是科学思维的一次重要跃升。`

2. 大语言模型技术基础

定义：通常是指具有超大规模参数的预训练语言模型
架构: 主要为Transformer架构
训练：预训练(base model)、后训练(instruct model)

2.1 大语言模型与训练(Pre-training)

定义：使用与下游任务无关的大规模数据进行模型参数的初始训练

2.2 大语言模型后训练(Post-Training)

上一篇：清华率先开源 AI 制药智能体平台！生物科研进入 Autopilot 时代

下一篇：Qt/C++音视频开发82-系统音量值获取和设置/音量大小/静音

热门推荐

01GitHub 镜像站点 02OpenClaw 使用和管理 MCP 完全指南 03OpenClaw + 飞书（Feishu）环境搭建指南 04Window 10部署openclaw报错node.exe : npm error code 128 05本地部署 OpenClaw + DeepSeek-R1 完全指南 06Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 07OpenClaw优化飞书API 额度已耗尽问题 08OpenClaw 连接飞书完整指南：插件安装、配置与踩坑记录 09小黑课堂计算机二级WPSoffice题库软件下载安装教程（2026年3月最新版）10OpenClaw 飞书机器人不回复消息？3 小时踩坑总结