AI大模型介绍 - 技术栈

AI大模型介绍

小趴菜不能喝2025-03-22 19:53

大模型介绍

大模型是指具有大规模参数和复杂计算结构的机器学习模型，通常由深度神经网络构建而成，拥有数十亿甚至数千亿个参数

开发大模型不是从0开始，是建立在已有的大模型基座模型上做开发，构建企业知识库（向量数据库）Embedding 将词向量化例如我是一个人向量化为132345435

在AI应用输入之后，得到错误的回答，证明结果不准确，可能有以下原因

1、没问清楚（提示工程）

2、缺乏相关知识（RAG）

3、能力不足（微调）

4、私有化部署

在大模型开发中要做的就是提示工程、RAG 、微调、再加一个私有化部署

对个人、企业的知识库中的数据进行拆分并且向量化存入向量数据库，用户问问题，在向量数据库中匹配，拿出相似度TopN个的段落，在结合问题，生成prompt（提示词）交给大模型得出结果。RAG的配置使大模型变得更聪明

在拿到基座模型以后，会对大模型进行参数微调，不采用全参微调，针对基座模型进行微调以后，将会对企业内部的一些问题回答的更加正确，不适合做通用型的回答

模型微调等于小批量的训练模型

Ollama Search，可以选择阿里的Qwen、gem、deepseek r1 GLM等