AI大模型介绍

大模型介绍

大模型是指具有大规模参数和复杂计算结构的机器学习模型,通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数

开发大模型不是从0开始,是建立在已有的大模型基座模型上做开发,构建企业知识库(向量数据库)Embedding 将词向量化 例如 我是一个人 向量化为132345435

AI应用错误回答

在AI应用输入之后,得到错误的回答,证明结果不准确,可能有以下原因

1、没问清楚(提示工程)

2、缺乏相关知识(RAG

3、能力不足(微调)

4、私有化部署

在大模型开发中要做的就是 提示工程、RAG 、微调、再加一个私有化部署

RAG原理

对个人、企业的知识库中的数据进行拆分并且向量化存入向量数据库, 用户问问题,在向量数据库中匹配,拿出相似度TopN个的段落,在结合问题,生成prompt(提示词)交给大模型得出结果。RAG的配置使大模型变得更聪明

大模型微调

在拿到基座模型以后,会对大模型进行参数微调,不采用全参微调,针对基座模型进行微调以后,将会对企业内部的一些问题回答的更加正确,不适合做通用型的回答

模型微调等于小批量的训练模型

可用的免费商用授权的基座大模型

Ollama Search,可以选择阿里的Qwen、gem、deepseek r1 GLM等

相关推荐
龙文浩_几秒前
AI NLP核心技术指南
人工智能·pytorch·深度学习·神经网络·自然语言处理
血小溅1 分钟前
大脑与双手的分离:Claude Code vs Managed Agents 深度对比指南
人工智能
星爷AG I3 分钟前
19-4 模糊语言学(AGI基础理论)
人工智能·agi
格林威5 分钟前
工业相机 SDK 在 Docker 容器中的部署与权限配置(含 USB/GigE)
开发语言·人工智能·数码相机·计算机视觉·docker·容器·工业相机
SkyXZ~10 分钟前
从零开始的双臂具身VLA起源及现阶段发展综述
人工智能·机械臂·具身智能·vla·openvla·双臂具身·具身智能综述
AIData搭子13 分钟前
高并发场景下,如何让你的向量语义检索快人一步?
人工智能
江南月13 分钟前
让智能体边想边做:从 0 理解 ReActAgent 的工作方式
前端·人工智能
AI攻城狮14 分钟前
Vibe Coding 时代:为什么你不应该盲目启用 AI 编码插件
人工智能·云原生·aigc
两万五千个小时14 分钟前
Claude Code 源码:Agent 工具 — 多 Agent 的路由与定义机制
人工智能·程序员·架构
江南月16 分钟前
让智能体学会自我改进:从 0 理解 ReflectionAgent 的迭代优化
前端·人工智能