AI大模型介绍

大模型介绍

大模型是指具有大规模参数和复杂计算结构的机器学习模型,通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数

开发大模型不是从0开始,是建立在已有的大模型基座模型上做开发,构建企业知识库(向量数据库)Embedding 将词向量化 例如 我是一个人 向量化为132345435

AI应用错误回答

在AI应用输入之后,得到错误的回答,证明结果不准确,可能有以下原因

1、没问清楚(提示工程)

2、缺乏相关知识(RAG

3、能力不足(微调)

4、私有化部署

在大模型开发中要做的就是 提示工程、RAG 、微调、再加一个私有化部署

RAG原理

对个人、企业的知识库中的数据进行拆分并且向量化存入向量数据库, 用户问问题,在向量数据库中匹配,拿出相似度TopN个的段落,在结合问题,生成prompt(提示词)交给大模型得出结果。RAG的配置使大模型变得更聪明

大模型微调

在拿到基座模型以后,会对大模型进行参数微调,不采用全参微调,针对基座模型进行微调以后,将会对企业内部的一些问题回答的更加正确,不适合做通用型的回答

模型微调等于小批量的训练模型

可用的免费商用授权的基座大模型

Ollama Search,可以选择阿里的Qwen、gem、deepseek r1 GLM等

相关推荐
中杯可乐多加冰1 小时前
OpenClaw到底能做什么?有什么用?先装这几个实用的Skills
人工智能
千寻girling1 小时前
一份不可多得的 《 Python 》语言教程
人工智能·后端·python
aircrushin3 小时前
从春晚看分布式实时协同算法与灵巧手工程实现
人工智能·机器人
恋猫de小郭3 小时前
Apple 的 ANE 被挖掘,AI 硬件公开,宣传的 38 TOPS 居然是"数字游戏"?
前端·人工智能·ios
银河系搭车客指南4 小时前
AI Agent 的失忆症:我是怎么给它装上"第二个大脑"的
人工智能
张拭心4 小时前
春节后,有些公司明确要求 AI 经验了
android·前端·人工智能
我的username4 小时前
极致简单的openclaw安装教程
人工智能
小锋java12344 小时前
【技术专题】嵌入模型与Chroma向量数据库 - Chroma 集合操作
人工智能
七月丶4 小时前
别再手动凑 PR 了:这个 AI Skill 会按仓库习惯自动建分支、拆提交、提 PR
人工智能·设计模式·程序员
用户5191495848454 小时前
CVE-2024-10793 WordPress插件权限提升漏洞利用演示
人工智能·aigc