零基础学AI大模型之AI大模型常见概念

大家好，我是工藤学编程 🦉	一个正在努力学习的小博主，期待你的关注
实战代码系列最新文章😉	C++实现图书管理系统（Qt C++ GUI界面版）
SpringBoot实战系列🐷	【SpringBoot实战系列】SpringBoot3.X 整合 MinIO 存储原生方案
分库分表	分库分表之实战-sharding-JDBC分库分表执行流程原理剖析
消息队列	深入浅出 RabbitMQ-RabbitMQ消息确认机制（ACK）
AI大模型	零基础学AI大模型之SpringAI

前情摘要：
1、零基础学AI大模型之读懂AI大模型
 2、零基础学AI大模型之从0到1调用大模型API
3、零基础学AI大模型之SpringAI

本文章目录

零基础学AI大模型之AI大模型常见概念
- 一、先搞懂：什么是AI大模型？
- 二、AI大模型的6个核心概念
- - [1. 提示词（Prompts）](#1. 提示词（Prompts）)
  - [2. 令牌（Tokens）：大模型的"语言最小单位"](#2. 令牌（Tokens）：大模型的“语言最小单位”)
  - [3. 嵌入（Embeddings）](#3. 嵌入（Embeddings）)
  - [4. 结构化输出（Structured Output）](#4. 结构化输出（Structured Output）)
  - [5. 检索增强生成（RAG）](#5. 检索增强生成（RAG）)
  - [6. 工具调用（Tool Calling/Function Call）](#6. 工具调用（Tool Calling/Function Call）)
  - [6. AI大模型概念总结](#6. AI大模型概念总结)

零基础学AI大模型之AI大模型常见概念

一、先搞懂：什么是AI大模型？

AI大模型（AI Models）本质是具备大规模参数、能模拟人类认知功能的信息处理算法------它不仅能"读懂"输入（比如文本、语音、图像），还能"生成"符合需求的输出（比如对话、图片、代码），核心优势是"泛化能力强"：不用针对单个场景单独训练，就能应对多种任务（比如既会写邮件，也能做数据分析）。

而SpringAI作为开发者常用的框架，直接为大模型提供了"落地工具"，支持多种核心模型类型，覆盖大部分业务场景：

聊天模型：核心是"对话与文本生成"，比如客服机器人回复咨询、自动生成周报，甚至帮开发者写接口文档；
嵌入模型：负责"文本向量化"，把文字变成计算机能理解的"数字向量"，是后续语义搜索、相似内容匹配的基础；
图像生成模型：实现"文本→图像"转换，比如输入"蓝色天空下的白色风车"，就能生成对应的图片；
语音模型：处理"语音↔文本"双向转换，比如会议录音转文字、文字稿合成播报语音。

二、AI大模型的6个核心概念

如果把AI大模型比作"智能大脑"，下面这些概念就是它的"神经中枢"------决定了它"怎么思考""怎么干活""怎么不犯错"。

1. 提示词（Prompts）

提示词不是简单的"一句话提问"，而是引导模型输出符合预期的"语言输入基础"。在SpringAI里，它被拆成了3个关键部分，分工明确：

系统消息：定"规则"，比如"你是一名技术文档助手，回答需简洁，只讲Java相关内容"；
用户消息：提"需求"，比如"帮我解释SpringAI的嵌入模型用法"；
助手消息：存"历史"，记录模型之前的响应，确保对话连贯（比如多轮咨询时，模型不会忘记上一轮的问题）。

开发者还能用StringTemplate等模板引擎优化提示词，比如做一个"生成笑话"的模板："讲一个{type}类型的笑话，主角是{role}"，后续只需填充"冷笑话""程序员"这样的占位符，就能快速适配不同用户输入。

2. 令牌（Tokens）：大模型的"语言最小单位"

你可能听过"ChatGPT3只能处理4K内容"，这里的"4K"指的就是令牌（Tokens）------大模型处理语言的基本单位，相当于人类说话的"词语片段"。

换算规则：英文里1个Token约等于0.75个单词（比如《莎士比亚全集》90万字，约合120万Token）；中文里1个Token约对应1-2个汉字；
核心影响：直接关联"成本"和"能力上限"：
- 费用：AI服务按"输入+输出"的Token总数收费，比如输入1000Token、输出500Token，就按1500Token计费；
- 限制：每个模型有"上下文窗口"（Token上限），比如GPT3是4K、GPT4有8K/16K/32K版本，超过上限的内容会被"截断"，模型无法处理。

DeepSeek示例

3. 嵌入（Embeddings）

嵌入是大模型"理解语义"的关键技术------把文本、图像等信息转换成浮点数组（向量），就像给每个内容分配一个"数字坐标"：语义越相似的内容，坐标越近（比如"猫"和"狗"的向量距离，比"猫"和"汽车"近）。

核心用途：最常见于"语义搜索"，比如在企业文档库里搜"请假流程"，嵌入模型能找到"休假申请步骤""事假审批规则"等相似内容；
与RAG的关联：后续要讲的RAG技术，核心就是靠嵌入模型把文档转成向量，再存到向量数据库里，方便后续检索。

4. 结构化输出（Structured Output）

传统AI输出是字符串（比如即使返回JSON，也得手动转成Java对象），而结构化输出能让模型直接生成开发者需要的数据格式 ，省去解析步骤。

比如在SpringAI里，想获取5个"Order"对象，只需这样写：

java 复制代码

List<Order> Order = chatClient.prompt()
  .user("CCC给我5个订单信息")
  .call()
  .entity(new ParameterizedTypeReference<List<Order>>() {});

5. 检索增强生成（RAG）

大模型有个短板：训练数据有"截止日期"（比如2023年的模型不知道2024年的新政策），而RAG（Retrieval Augmented Generation）就是通过"实时检索外部数据"，让模型输出更精准、更实时。

核心流程（类似ETL管道）：
1. 提取：把非结构化数据（比如PDF文档、Word手册）拿出来；
2. 转换：拆分成"符合Token限制"的片段（关键是不拆段落、代码方法，保留语义），再用嵌入模型转成向量；
3. 加载：把向量存到向量数据库里；
应用场景：比如用户问"2024年个税起征点是多少"，RAG会先从数据库里检索2024年的个税政策文档，再把"政策内容+用户问题"一起传给模型，让模型基于最新数据回答，避免"答非所问"。

6. 工具调用（Tool Calling/Function Call）

大模型本身不能查天气、查股票，但工具调用能让它"调用外部API"，获取实时数据或执行操作，相当于给模型装了"外接大脑"。

简化流程（以SpringAI为例）：
1. 用@Tool注解定义工具（比如"天气查询工具"，说明参数是"城市名""日期"）；
2. 模型判断是否需要调用工具（比如用户问"北京明天天气"，模型会决定调用天气API）；
3. 应用执行工具，返回"北京明天晴，气温15-25℃"；
4. 模型基于这个结果，生成自然语言回答。
价值：让模型从"只懂理论"变成"能做实事"，比如自动查物流、生成实时报表。

6. AI大模型概念总结

觉得有用请点赞收藏！

如果有相关问题，欢迎评论区留言讨论~