AI大模型介绍

大模型介绍

大模型是指具有大规模参数和复杂计算结构的机器学习模型,通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数

开发大模型不是从0开始,是建立在已有的大模型基座模型上做开发,构建企业知识库(向量数据库)Embedding 将词向量化 例如 我是一个人 向量化为132345435

AI应用错误回答

在AI应用输入之后,得到错误的回答,证明结果不准确,可能有以下原因

1、没问清楚(提示工程)

2、缺乏相关知识(RAG

3、能力不足(微调)

4、私有化部署

在大模型开发中要做的就是 提示工程、RAG 、微调、再加一个私有化部署

RAG原理

对个人、企业的知识库中的数据进行拆分并且向量化存入向量数据库, 用户问问题,在向量数据库中匹配,拿出相似度TopN个的段落,在结合问题,生成prompt(提示词)交给大模型得出结果。RAG的配置使大模型变得更聪明

大模型微调

在拿到基座模型以后,会对大模型进行参数微调,不采用全参微调,针对基座模型进行微调以后,将会对企业内部的一些问题回答的更加正确,不适合做通用型的回答

模型微调等于小批量的训练模型

可用的免费商用授权的基座大模型

Ollama Search,可以选择阿里的Qwen、gem、deepseek r1 GLM等

相关推荐
用户5191495848451 分钟前
curl --continue-at 参数异常行为分析:文件覆盖与删除风险
人工智能·aigc
用户84913717547162 分钟前
joyagent智能体学习(第1期):项目概览与架构解析
人工智能·llm·agent
是乐谷2 分钟前
阿里云杭州 AI 产品法务岗位信息分享(2025 年 8 月)
java·人工智能·阿里云·面试·职场和发展·机器人·云计算
用户5191495848454 分钟前
初识ARIA时我希望有人告诉我的事:Web无障碍开发指南
人工智能·aigc
AI知识管理14 分钟前
AI知识管理产品落地设计方案
人工智能·产品
weixin_5079299117 分钟前
第G7周:Semi-Supervised GAN 理论与实战
人工智能·pytorch·深度学习
一叶飘零_sweeeet35 分钟前
IDEA 插件 Trae AI 全攻略
java·人工智能·intellij-idea
SEO_juper1 小时前
AI 搜索时代:引领变革,重塑您的 SEO 战略
人工智能·搜索引擎·seo·数字营销·seo优化
shengyicanmou1 小时前
深度解码格行无缝切网引擎:40%延迟降低背后的多网智能切换架构
人工智能·物联网·智能硬件
Hello123网站2 小时前
GLM-4-Flash:智谱AI推出的首个免费API服务,支持128K上下文
人工智能·ai工具