AI大模型介绍

大模型介绍

大模型是指具有大规模参数和复杂计算结构的机器学习模型,通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数

开发大模型不是从0开始,是建立在已有的大模型基座模型上做开发,构建企业知识库(向量数据库)Embedding 将词向量化 例如 我是一个人 向量化为132345435

AI应用错误回答

在AI应用输入之后,得到错误的回答,证明结果不准确,可能有以下原因

1、没问清楚(提示工程)

2、缺乏相关知识(RAG

3、能力不足(微调)

4、私有化部署

在大模型开发中要做的就是 提示工程、RAG 、微调、再加一个私有化部署

RAG原理

对个人、企业的知识库中的数据进行拆分并且向量化存入向量数据库, 用户问问题,在向量数据库中匹配,拿出相似度TopN个的段落,在结合问题,生成prompt(提示词)交给大模型得出结果。RAG的配置使大模型变得更聪明

大模型微调

在拿到基座模型以后,会对大模型进行参数微调,不采用全参微调,针对基座模型进行微调以后,将会对企业内部的一些问题回答的更加正确,不适合做通用型的回答

模型微调等于小批量的训练模型

可用的免费商用授权的基座大模型

Ollama Search,可以选择阿里的Qwen、gem、deepseek r1 GLM等

相关推荐
h64648564h10 分钟前
CANN 性能剖析与调优全指南:从 Profiling 到 Kernel 级优化
人工智能·深度学习
数据与后端架构提升之路12 分钟前
论系统安全架构设计及其应用(基于AI大模型项目)
人工智能·安全·系统安全
忆~遂愿15 分钟前
ops-cv 算子库深度解析:面向视觉任务的硬件优化与数据布局(NCHW/NHWC)策略
java·大数据·linux·人工智能
Liue6123123119 分钟前
YOLO11-C3k2-MBRConv3改进提升金属表面缺陷检测与分类性能_焊接裂纹气孔飞溅物焊接线识别
人工智能·分类·数据挖掘
一切尽在,你来28 分钟前
第二章 预告内容
人工智能·langchain·ai编程
23遇见31 分钟前
基于 CANN 框架的 AI 加速:ops-nn 仓库的关键技术解读
人工智能
Codebee40 分钟前
OoderAgent 企业版 2.0 发布的意义:一次生态战略的全面升级
人工智能
光泽雨1 小时前
检测阈值 匹配阈值分析 金字塔
图像处理·人工智能·计算机视觉·机器视觉·smart3
Σίσυφος19001 小时前
PCL 法向量估计-PCA邻域点(经典 kNN 协方差)的协方差矩阵
人工智能·线性代数·矩阵
小鸡吃米…2 小时前
机器学习的商业化变现
人工智能·机器学习