大模型技术路线及场景选型指南

一、基础认知与选型

核心目标：搞懂大模型是什么、能做什么、怎么选

技术重点

1. 大模型基础概念：

通用大模型：GPT、Qwen、Llama、DeepSeek等
模型参数规模：7B/14B/32B/70B...、上下文窗口、推理速度
部署形态：云服务API、本地部署、私有化部署

2. 选型判断逻辑：

选型维度	云服务API（如通义千问、Qwen API）	开源模型本地部署	商业私有化部署
适用场景	快速验证、轻量业务、无数据敏感	技术探索、定制化需求	高安全、高合规业务（如汽车、金融）
开发成本	极低（直接调用）	中（需部署、调优）	高（需采购、运维）
数据安全	数据需上传云端	数据本地留存	数据完全可控
迭代速度	快（厂商自动更新）	慢（需手动升级）	中（厂商协助更新）

二、Prompt工程

核心目标：让通用大模型输出符合业务需求的结果

技术重点

1. Prompt设计技巧：

角色定义：你是一名汽车信息安全专家，擅长TARA分析
任务拆解：请先识别整车功能中的网络安全相关项，再生成威胁清单
格式约束：输出格式为JSON，包含威胁描述、影响等级、防护措施
示例引导：Few-shot Learning（给几个正确案例，让模型模仿）

2. 高级技巧：

思维链（Chain of Thought）：请一步步思考，先分析功能，再识别威胁
自我校正：请检查你的输出，是否符合ISO/SAE 21434标准
多轮对话：通过上下文引导模型逐步完善结果

什么时候用？

所有场景的基础：先通过Prompt优化验证效果，再考虑更复杂技术
轻量业务：不需要补充知识、不需要对接系统的场景（如简单文本生成、问答）
快速验证：用Prompt就能满足需求的场景，绝对不要提前上RAG/微调/AI Agent

三、RAG（检索增强生成）

核心目标：让大模型懂业务知识，不胡说、不编造

技术重点

1. 核心流程：

数据准备：业务文档（TARA报告、ISO标准、供应商资质等）→ 清洗 → 分块
向量 embedding：将文本转成向量（用BGE、m3e等开源Embedding模型）
向量存储：存入向量数据库（Milvus $企业级$ 、FAISS、Chroma）
检索生成：用户提问 → 检索相似知识 → 喂给大模型 → 生成回答

2. 关键优化点：

分块策略：按段落/语义分块，避免信息碎片化
检索召回：优化向量相似度计算，提升召回准确率
重排序：用小模型对检索结果重排序，提升相关性
上下文管理：控制检索结果长度，避免超出模型上下文窗口

什么时候用？

需要专属知识：大模型本身不知道的业务知识（如整车架构、内部安全标准）
知识需要更新：法规、标准、业务流程变化快（如ISO/SAE 21434更新）
避免幻觉：需要大模型基于真实数据回答，不能编造（如TARA威胁识别、数据安全合规）
替代微调：不想/不能训练模型时，RAG是最优解
为AI Agent提供知识支撑：作为智能体的核心知识模块，解决其知识陈旧、幻觉问题

四、Function Calling / 工具调用

核心目标：让大模型对接系统、执行动作，从说话到做事

技术重点

1. 核心能力：

工具定义：将业务系统API封装成工具（如「推送审核结果」「触发VSOC告警」）
函数选择：大模型根据用户需求，自动选择需要调用的工具
参数填充：自动提取参数（如供应商ID、威胁等级），调用工具
结果整合：将工具返回结果整理成自然语言回答

2. 框架选型：

Python：LangChain、LlamaIndex
Java：SpringAI、SpringAI Alibaba
云服务：通义千问Function Calling、GPT Functions

什么时候用？

需要对接现有系统：大模型需要读写业务数据（如供应商管理平台、VSOC系统）
流程自动化：端到端完成业务流程（如资质核验→结果推送→整改跟踪）
实时数据获取：需要查询实时数据（如车辆状态、告警数据）
替代人工操作：减少重复人工操作，提升效率（如自动生成报告并推送）
作为AI Agent的核心执行模块：支撑智能体完成跨系统操作、落地实际业务动作

五、AI Agent（智能体）

核心目标：融合大模型+RAG+Function Calling能力，实现自主规划、闭环执行复杂业务

技术定义

AI Agent是具备自主感知、任务规划、工具调用、记忆迭代、反思优化的高阶AI系统，以大模型为核心大脑，融合RAG、Function Calling等技术，可完成多步骤、跨环节、端到端的复杂业务流程，区别于单一技术的"单点能力"，实现从"被动响应"到"主动执行"的升级。

技术重点

1. 核心架构模块：

感知模块：接收用户自然语言需求，解析核心目标与约束条件
规划模块：将复杂需求拆解为可执行的子任务，制定执行路径（如"数据分析→报告生成→系统推送→结果反馈"）
记忆模块：包含短期记忆（对话上下文、任务执行过程）和长期记忆（历史案例、业务经验、用户偏好），基于向量数据库实现存储与检索
工具调用模块：集成Function Calling能力，根据子任务自动选择并调用对应工具/系统API
反思模块：复盘任务执行结果，校验是否达成目标，若出现错误/偏差则自动调整执行路径
执行与反馈模块：落地子任务执行，整合所有结果并向用户反馈，同时将经验沉淀至长期记忆

2. 框架选型：

通用轻量框架：LangChain Agent、LlamaIndex Agent（基于Python，快速搭建原型）
企业级工程化框架：SpringAI、SpringAI Alibaba（基于Java，适配企业级系统集成、高可用需求）
专用智能体平台：AutoGPT、MetaGPT（适用于复杂多任务协同场景）

什么时候用？

业务流程复杂：需跨3个及以上环节/系统，人工操作步骤多、重复度高（如全流程资质审核、端到端威胁处置）
需自主决策与闭环：需求模糊/多维度，需要AI自主拆解任务、规划路径并完成全流程执行，无需人工逐步干预
多技术融合需求：单一RAG/Function Calling无法满足，需要同时结合知识检索、系统调用、历史经验复用等能力
追求极致效率与降本：人工处理耗时占比高、体验差，需要AI实现7×24小时自主化业务处理
知识与经验沉淀需求：需要将业务执行经验持续沉淀，实现能力迭代与复用

核心技术依赖

AI Agent是技术融合体，无法独立落地，其核心能力依赖前置技术：

基础大脑：大模型（Prompt工程优化后）
知识支撑：RAG（解决专属知识与幻觉问题）
执行能力：Function Calling（解决系统对接与实际动作落地）
数据存储：向量数据库（支撑记忆模块与知识检索）

六、模型微调（让大模型更懂业务）

核心目标：在通用大模型基础上，定制化适配业务场景，提升效果

技术重点

1. 微调类型：

全参数微调：更新模型所有参数，效果最好，但成本极高（需大量数据+算力）
参数高效微调（PEFT）：只更新少量参数（如LoRA、QLoRA），成本低、效果好，工业界主流

2. 核心流程：

数据准备：业务场景标注数据（如TARA威胁识别样本、敏感数据样本）→ 格式化成指令数据集
框架选择：PEFT（LoRA）+ Transformers + Accelerate
训练配置：低精度训练（FP16/FP8/4-bit），节省算力
效果验证：对比微调前后效果，验证业务指标（如识别准确率、一致性）

3. 关键注意事项：

数据质量 > 数据数量：高质量标注数据是关键
过拟合风险：避免训练数据过少，导致模型泛化能力差
算力需求：至少需要A10/A100级GPU，或使用云算力服务

什么时候用？

RAG/Function Calling/AI Agent基础版无法满足：Prompt+RAG+Function Calling优化到极限，AI Agent的决策/规划能力仍不达标
业务场景特殊：通用大模型完全不理解行业/企业专属逻辑，导致AI Agent规划错误、工具调用失准
追求AI Agent极致效果：需要智能体的任务规划、反思优化能力更贴合业务，输出高度一致、专业
有足够数据：至少需要几百~几千条高质量业务标注数据（含任务拆解、决策规划类样本）
成本可承受：能承担算力成本、数据标注成本，且有专业AI算法团队支撑

七、大模型底层与自研

核心目标：理解大模型底层原理，自研/深度定制模型

技术重点

1. 底层原理：

Transformer架构：注意力机制、编码器/解码器
预训练技术：自监督学习、因果语言模型（CLM）
推理优化：KV缓存、量化（INT8/INT4）、蒸馏

2. 自研/深度定制：

预训练：基于开源基座（如Llama、Qwen），用自有数据继续预训练
架构创新：针对特定场景优化模型结构（如时序大模型、多模态大模型、智能体专用大模型）
推理部署：模型压缩、分布式推理、服务化封装

3. 工具生态：

训练框架：PyTorch、TensorFlow、MegEngine
部署框架：vLLM、TensorRT-LLM、ONNX Runtime

什么时候用？

企业级战略投入：需要构建核心AI技术壁垒，打造专属大模型与智能体体系
场景极度特殊：现有开源/商业模型完全无法满足，导致AI Agent核心能力受限（如车联网专用智能体、工业制造决策智能体）
算力/人才充足：有强大的AI算法、工程化团队，且具备规模化算力集群
大规模AI Agent落地需求：企业内需要部署多场景、多类型智能体，需要自研模型实现统一适配与高效支撑

八、选型决策

技术优先级

Prompt提示词工程化 → RAG检索增强 → Function Calling工具调用 → AI Agent智能体 → 微调模型 → 全参数训练模型 → 大模型底层与自研

通用选型思路

准备测试数据，用对话应用基于Prompt工程验证核心需求可行性；
判定是否需要补充专属知识：是→接入RAG，否→进入下一步；
判定是否需要对接其它业务系统：是→开发Function Calling工具调用能力，否→进入下一步；
判定业务是否为复杂流程、需要自主闭环执行：是→搭建AI Agent智能体（融合上述所有能力），否→直接交付；
判定现有技术组合（Prompt+RAG+Function Calling/AI Agent）效果是否达标：否→基于业务数据做模型微调，是→直接交付；
现有模型完全无法适配时，考虑大模型底层自研/深度定制。

关于我：后续会持续分享 Agent 开发的实战经验，欢迎关注。