AI大模型介绍

大模型介绍

大模型是指具有大规模参数和复杂计算结构的机器学习模型,通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数

开发大模型不是从0开始,是建立在已有的大模型基座模型上做开发,构建企业知识库(向量数据库)Embedding 将词向量化 例如 我是一个人 向量化为132345435

AI应用错误回答

在AI应用输入之后,得到错误的回答,证明结果不准确,可能有以下原因

1、没问清楚(提示工程)

2、缺乏相关知识(RAG

3、能力不足(微调)

4、私有化部署

在大模型开发中要做的就是 提示工程、RAG 、微调、再加一个私有化部署

RAG原理

对个人、企业的知识库中的数据进行拆分并且向量化存入向量数据库, 用户问问题,在向量数据库中匹配,拿出相似度TopN个的段落,在结合问题,生成prompt(提示词)交给大模型得出结果。RAG的配置使大模型变得更聪明

大模型微调

在拿到基座模型以后,会对大模型进行参数微调,不采用全参微调,针对基座模型进行微调以后,将会对企业内部的一些问题回答的更加正确,不适合做通用型的回答

模型微调等于小批量的训练模型

可用的免费商用授权的基座大模型

Ollama Search,可以选择阿里的Qwen、gem、deepseek r1 GLM等

相关推荐
豆芽81922 分钟前
Vision Transformer(ViT)
人工智能·深度学习·目标检测·计算机视觉·transformer
Oliverro42 分钟前
嵌入式音视频通话EasyRTC基于WebRTC技术驱动智能带屏音箱:开启智能交互新体验
人工智能·音视频
終不似少年遊*1 小时前
MindSpore框架学习项目-ResNet药物分类-模型优化
人工智能·深度学习·机器学习·计算机视觉·分类·数据挖掘·华为云
GpuGeek2 小时前
一文走进GpuGeek | conda常用命令
人工智能·conda·gpu算力·云平台
背太阳的牧羊人2 小时前
SemanticSplitterNodeParser 和 Sentence-BERT 的区别和联系是什么
人工智能·深度学习·bert
饮啦冰美式2 小时前
PPO近端策略优化算法
人工智能·深度学习·算法
电棍2332 小时前
近日部署跑通的若干多模态模型总结与论文概述
人工智能·深度学习
VI8664956I263 小时前
企业级AI革命!私有化部署开源大模型:数据安全+自主可控,打造专属智能引擎
人工智能·开源
麦麦麦造3 小时前
[特殊字符]Meilisearch:AI驱动的现代搜索引擎
人工智能·搜索引擎
水煮蛋不加蛋3 小时前
AutoGen 框架解析:微软开源的多人 Agent 协作新范式
人工智能·microsoft·ai·开源·大模型·llm·agent