大语言模型应用和训练（人工智能）

杰克逊的日记2025-04-06 22:43

RAG（Retrieval Augmented Generation，检索增强生成）

定义：是一种将外部知识检索与语言模型生成能力相结合的技术。在传统的大语言模型中，模型的知识是在预训练阶段学到的，可能存在知识过时或不完整的问题。而 RAG 允许模型在生成回答时，从外部知识库（如文档集合、数据库等）中检索相关信息，并将这些信息融入到生成过程中，从而提升回答的准确性和时效性。
工作流程
1. 检索阶段：根据用户的输入问题，从外部知识库中检索出相关的文档或信息片段。
2. 生成阶段：将检索到的信息和用户的问题一起输入到语言模型中，模型根据这些信息生成最终的回答。
应用场景：适用于需要专业知识或实时信息的场景，如智能客服、知识问答系统等。

Agent（智能体）

定义：是一种能够感知环境、自主决策并执行相应动作的程序或系统。在大语言模型的背景下，Agent 可以利用语言模型的能力进行自然语言理解和生成，与用户进行交互，并根据用户的需求执行各种任务，如查询信息、调用工具、完成特定操作等。
工作原理：Agent 通常由多个组件组成，包括语言模型、工具调用模块、决策模块等。它接收用户的输入，使用语言模型理解用户的意图，然后根据预先设定的规则或通过决策模块进行推理，决定是否调用外部工具（如搜索引擎、计算器等）来完成任务，最后将处理结果返回给用户。
应用场景：广泛应用于自动化办公、智能助手、机器人控制等领域，能够帮助用户高效地完成各种复杂任务。

Prompt 调优（提示词调优）

定义：通过调整输入给大语言模型的提示词（Prompt）来引导模型生成更符合预期的输出。提示词是用户向模型提供的指令、上下文信息或示例，它可以影响模型的生成结果。不同的提示词可能会使模型产生不同的回答，因此通过优化提示词可以提高模型的性能和回答质量。
方法
- 手动调优：根据经验和实验，手动修改提示词的内容、结构和表达方式，观察模型的输出效果，逐步找到最优的提示词。
- 自动调优：使用自动化的方法，如基于搜索算法或强化学习的方法，在提示词空间中搜索最优的提示词组合。
应用场景：在各种基于大语言模型的应用中都非常重要，如文本生成、问答系统、机器翻译等。

SFT 训练（Supervised Fine - Tuning，有监督微调）

定义：是在大语言模型预训练的基础上，使用有标签的数据集进行进一步的微调训练。预训练模型通常是在大规模的无监督数据上进行训练的，虽然具有一定的语言理解和生成能力，但可能无法很好地满足特定任务的需求。通过 SFT 训练，可以让模型学习到特定任务的模式和规律，从而提高模型在该任务上的性能。
训练过程
1. 准备数据集：收集和整理与特定任务相关的有标签数据，如问题 - 答案对、文本分类标签等。
2. 微调模型：使用准备好的数据集对预训练模型进行微调，调整模型的参数以适应特定任务。
应用场景：常用于各种自然语言处理任务，如文本分类、情感分析、对话系统等。

上一篇：5G从专家到小白

下一篇：【蓝桥杯速成】日期问题（填空题） + 真题讲解 python

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 03国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）042026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 05微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 08Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 09AI科技热点日报 | 2026年07月01日 102026 年 AI 大模型 & AI 编程工具实战全总结