基础LLM 和指令调优LLM

基础LLM

基础LLM已经过训练,可以进行预测。根据文本训练数据(通常是训练数据)预测下一个词基于来自大量数据,通过互联网和其他资源来了解接下来会发生什么,最有可能紧随其后的词

复制代码
你问:"中国的首都是..."
它想:"根据我看过的书,'首都'后面最常见的是'北京'"
它答:"北京"

你问:"帮我总结一下这篇文章"
它想:"'总结'?我的训练数据里没有这个模式...还是继续写文章吧"
它答:把文章继续写下去了(而不是总结)

指令调优LLM

训练就是从基础开始。

使用大量文本数据训练的LLM模型,并进一步训练它,并使用作为指令的输入和输出对其进行进一步微调。

并努力遵循这些说明,然后通常会使用一种称为"技术"的技术进一步完善。

RLHF,即基于人类反馈的强化学习,使系统更有能力提供帮助,遵循指示。因为针对特定指令调整的LLM已经过训练。要乐于助人、诚实守信、无害

复制代码
你问:"帮我总结一下这篇文章"
它想:"哦,这是'总结'指令,我要提取要点"
它答:给出了简洁的总结

你问:"翻译成英文:今天天气好"
它想:"这是'翻译'指令,我要把中文转英文"
它答:"The weather is nice today"

对比

训练方式

基础LLM训练

text 复制代码
数据:[大量文本,如网页、书籍、论文]
目标:最大化 P(下一个词 | 前文)

例如:
输入: "今天天气真"
目标: "好"

指令调优LLM训练

text 复制代码
数据:[指令-回答] 对
目标:让模型学会"听到指令 → 执行任务"

例如:
输入: "指令:翻译成英文\n文本:你好"
目标: "Hello"

场景选择

用基础LLM的场景

  • 需要创意续写(小说、文案)

  • 需要代码补全

  • 你想自己控制输出风格

  • 资源有限,基础模型更小更快

用指令调优LLM的场景

  • 需要执行具体任务(翻译、总结、分类)

  • 需要对话式交互

  • 需要遵循格式要求(JSON输出、特定模板)

  • 用户不擅长写复杂提示词

相关推荐
城管不管7 小时前
Agent——001
android·java·数据库·llm·prompt
AINative软件工程8 小时前
LLM 应用的 Token 级可观测性:从 Trace 采集到 Cost Attribution 的工程落地
llm
nix.gnehc8 小时前
深入理解 LLM Chat API 调用参数:从 OpenAI 标准到国内厂商实践
llm·openai
星浩AI9 小时前
(六)模型微调效果测试:基于 BERT 的中文评价情感分析[附源码]
人工智能·机器学习·llm
树獭非懒10 小时前
AI Agent 入门:理论、原理与5分钟代码实战
人工智能·llm·agent
swipe20 小时前
DeepAgents 实战:用多 Agent 架构搭一个深度调研助手
javascript·面试·llm
XLYcmy1 天前
全链路验证测试系统:一个针对智能代理(Agent)系统全链路能力的自动化验证脚本
分布式·python·http·网络安全·ai·llm·agent
johnny2331 天前
大模型测评之:CLUE、SuperCLUE、GLUE、SuperGLUE
llm·benchmark
格桑阿sir1 天前
10-大模型智能体开发工程师:RAG检索增强生成
ai·大模型·llm·embedding·agent·检索增强·rag
swipe1 天前
DeepAgents middleware 工程实战:把复杂 Agent 的运行时基建交给可组合中间件
前端·面试·llm