大语言模型应用和训练(人工智能)

RAG(Retrieval Augmented Generation,检索增强生成)

  • 定义:是一种将外部知识检索与语言模型生成能力相结合的技术。在传统的大语言模型中,模型的知识是在预训练阶段学到的,可能存在知识过时或不完整的问题。而 RAG 允许模型在生成回答时,从外部知识库(如文档集合、数据库等)中检索相关信息,并将这些信息融入到生成过程中,从而提升回答的准确性和时效性。
  • 工作流程
    1. 检索阶段:根据用户的输入问题,从外部知识库中检索出相关的文档或信息片段。
    2. 生成阶段:将检索到的信息和用户的问题一起输入到语言模型中,模型根据这些信息生成最终的回答。
  • 应用场景:适用于需要专业知识或实时信息的场景,如智能客服、知识问答系统等。

Agent(智能体)

  • 定义:是一种能够感知环境、自主决策并执行相应动作的程序或系统。在大语言模型的背景下,Agent 可以利用语言模型的能力进行自然语言理解和生成,与用户进行交互,并根据用户的需求执行各种任务,如查询信息、调用工具、完成特定操作等。
  • 工作原理:Agent 通常由多个组件组成,包括语言模型、工具调用模块、决策模块等。它接收用户的输入,使用语言模型理解用户的意图,然后根据预先设定的规则或通过决策模块进行推理,决定是否调用外部工具(如搜索引擎、计算器等)来完成任务,最后将处理结果返回给用户。
  • 应用场景:广泛应用于自动化办公、智能助手、机器人控制等领域,能够帮助用户高效地完成各种复杂任务。

Prompt 调优(提示词调优)

  • 定义:通过调整输入给大语言模型的提示词(Prompt)来引导模型生成更符合预期的输出。提示词是用户向模型提供的指令、上下文信息或示例,它可以影响模型的生成结果。不同的提示词可能会使模型产生不同的回答,因此通过优化提示词可以提高模型的性能和回答质量。
  • 方法
    • 手动调优:根据经验和实验,手动修改提示词的内容、结构和表达方式,观察模型的输出效果,逐步找到最优的提示词。
    • 自动调优:使用自动化的方法,如基于搜索算法或强化学习的方法,在提示词空间中搜索最优的提示词组合。
  • 应用场景:在各种基于大语言模型的应用中都非常重要,如文本生成、问答系统、机器翻译等。

SFT 训练(Supervised Fine - Tuning,有监督微调)

  • 定义:是在大语言模型预训练的基础上,使用有标签的数据集进行进一步的微调训练。预训练模型通常是在大规模的无监督数据上进行训练的,虽然具有一定的语言理解和生成能力,但可能无法很好地满足特定任务的需求。通过 SFT 训练,可以让模型学习到特定任务的模式和规律,从而提高模型在该任务上的性能。
  • 训练过程
    1. 准备数据集:收集和整理与特定任务相关的有标签数据,如问题 - 答案对、文本分类标签等。
    2. 微调模型:使用准备好的数据集对预训练模型进行微调,调整模型的参数以适应特定任务。
  • 应用场景:常用于各种自然语言处理任务,如文本分类、情感分析、对话系统等。
相关推荐
一点一木3 小时前
🚀 2026 年 4 月 GitHub 十大热门项目排行榜 🔥
人工智能·github
淡海水4 小时前
【AI模型】常见问题与解决方案
人工智能·深度学习·机器学习
HIT_Weston5 小时前
65、【Agent】【OpenCode】用户对话提示词(费米估算)
人工智能·agent·opencode
njsgcs5 小时前
我的知识是以图片保存的,我的任务状态可能也与图片有关,我把100张知识图片丢给vlm实时分析吗
人工智能
星爷AG I5 小时前
20-4 长时工作记忆(AGI基础理论)
人工智能·agi
王老师青少年编程5 小时前
csp信奥赛C++高频考点专项训练之贪心算法 --【哈夫曼贪心】:合并果子
c++·算法·贪心·csp·信奥赛·哈夫曼贪心·合并果子
#卢松松#5 小时前
用秒悟(meoo)制作了一个GEO查询小工具。
人工智能·创业创新
zandy10115 小时前
Agentic BI 架构实战:当AI Agent接管数据建模、指标计算与可视化全链路
人工智能·架构
数字供应链安全产品选型5 小时前
关键领域清单+SBOM:834号令下软件供应链的“精准治理“逻辑与技术落地路径
人工智能·安全
Flying pigs~~5 小时前
RAG智慧问答项目
数据库·人工智能·缓存·微调·知识库·rag