SpringAI+DeepSeek大模型应用开发——1 AI概述

AI领域常用词汇

LLM(LargeLanguage Model,大语言模型)

能理解和生成自然语言的巨型AI模型,通过海量文本训练。例子:GPT-4、Claude、DeepSeek、文心一言、通义干问。

  • G(Generative)生成式: 根据上文预测之后应该出现哪个文本,从而形成连续的文本输出

  • P(Pre-trained)预训练: 通过大规模的文本数据进行预训练,让大模型可以理解人类语言的语法、词性。

  • T(Transformer)Transformer: 深度学习的一种神经网络模型。多数AIGC模型都依赖于此

感知能力:海量文本训练,接收用户输入文本,,PDF,图片==>OCR==>转成文本,但是会损失很多信息,如颜色布局,色调等

机器学习

基于数据,通过统计和优化方法训练模型。包括监督学习、无监督学习和强化学习等子领域。应用: 游戏AI、推荐引擎

深度学习(DeepLearning)

解释:模仿人脑神经网络结构的机器学习方法,需要大量数据和算力。

例子:图像识别、语音转文字。

神经网络(NeuralNetwork)

解释:由多层"虚拟神经元"组成的计算模型,AI学习的基础架构。

NLP(NaturalLanguageProcessing,自然语言处理)

解释:让计算机理解、生成人类语言的技术。

应用:机器翻译、情感分析。

多模态(Multimodal)

能同时处理文本、图像、语音等多种类型数据的AI。

例子:GPT-4V 可以分析图片内容并回答问题。

  1. 视觉感知:端到端视觉感知,输入图片,直接能获取所有信息

  2. 多模态感知:包括声音语气语调,视频时序等信息

  3. 推理能力:利用CoT和ToT思维链,模型思考问题前,进行问题拆解

  4. 工作流+多智能体:各个AI各司其职协作完成任务,缺点是任务分工还是人为定好的

  5. 模型即Agent-深度搜索:模型自主决定什么时候搜索或整理信息

检索增强生成(RAG)

对大型语言模型输出进行优化,使其能够在生成响应之前引用训练数据来源之外的权威知识库

例子:RAG广泛应用于各种自然语言处理任务,包括问答系统、知识图谱构建、智能客服等,能够显著提升大模型在实际业务场景中的表现。

更多更专业的名词可参考Spring AI Alibaba 项目的介绍:Chat Client,里面有可运行的代码,工具(Function Calling) 向量存储(Vector Store)

AI Agent

Agent直译过来就是代理,结合AI来看就是 智能体,核心:实现AI自主完成任务==>收到任务指令==>感知环境+独立思考+主动实践

行动能力

  1. 初级-大模型函数调用:模型感觉要调用某个工具==>生成一段API调用文本==>过滤器识别==>找到对应的功能函数去调用==>返回答案

  2. 训练模型控制浏览器(manus操作网页来源)

  3. MCP模型上下文协议:统一各个API工具接口的格式,比如股票接口和计算器接口 都有TypeC格式去接入模型

记忆能力

  1. 增加上下文长度

  2. RAG(检索增强生成)==>延长模型对话记忆==>中途总结前面的对话+偶尔回顾==>记忆模块

  3. DeepSeek稀疏注意力机制

manus

  1. 规划+工具==>生成待办事项todo

  2. 调用搜索工具搜索网页,待办事项打勾

DeepSeek
  • 基础模型(V3):通用模型,高效便捷,适用于绝大多数任务, " 规范性"任务 ,聪明且听话

  • 深度思考(R1):文本推理模型,复杂推理和深度分析任务,如数理逻辑推理和编程代码,聪明但不听话

  • 联网搜索:RAG(检索增强生成),知识库更新至24年7月

如何提问?

  • 基础模型(V3):"过程-结果"清晰(指令)

  • 深度思考(R1):目标清晰,结果可以模糊(推理)

提示词结构

  1. 定义AI的角色: 经验丰富的数据分析师 具备十年销售经验的SaaS系统商务

  2. 期望达成什么目标效果: 通过该文案吸引潜在客户,促成消 费......通过该报告为相关企业管理 者提供......策略支撑

  3. 具体任务描述: 写一份关于XXX活动的小红书宣推文案 写一份关于XX事件的舆论分析报告 (XX活动/事件相关背景信息如下......)

  4. Objective(操作要求) 字数要求、段落结构、用词风格、 内容要点、输出格式...

Manus能力

  1. 展示窗口

  2. 调用搜索工具

  3. 浏览网页

  4. 命令行

  5. 多轮搜索

  6. 编程和部署

Spring AI

一个大模型应用框架。目标:将人工智能领域无缝接入Spring 生态体系,快速改造传统项目

为什么选择 SpringAI?

目前大模型应用开发最常见的框架就是LangChain,然而LangChain是基于Python语言,虽然有LangChain4j,但是对于大量使用Spring生态的应用来说,适配性就稍微差了些;

而Spring公司推出的SpringAI框架,充分利用了Spring框架中AOP、IOC的能力,可以与现有的Java项目无缝融合,非常方便;

  • JDK版本至少是JDK17,SpringBoot也必须是3.x的版本;

  • 如果是比较老的项目,也可以考虑采用LangChain4j,它要求的最低JDK版本为JDK8。

  • SpringAI官方文档:Spring AI Reference

相关推荐
我命由我123452 小时前
Kotlin 数据容器 - List(List 概述、创建 List、List 核心特性、List 元素访问、List 遍历)
java·开发语言·jvm·windows·java-ee·kotlin·list
白-胖-子4 小时前
深入剖析大模型在文本生成式 AI 产品架构中的核心地位
人工智能·架构
武子康4 小时前
Java-80 深入浅出 RPC Dubbo 动态服务降级:从雪崩防护到配置中心秒级生效
java·分布式·后端·spring·微服务·rpc·dubbo
想要成为计算机高手5 小时前
11. isaacsim4.2教程-Transform 树与Odometry
人工智能·机器人·自动驾驶·ros·rviz·isaac sim·仿真环境
静心问道6 小时前
InstructBLIP:通过指令微调迈向通用视觉-语言模型
人工智能·多模态·ai技术应用
宇称不守恒4.06 小时前
2025暑期—06神经网络-常见网络2
网络·人工智能·神经网络
小楓12017 小时前
醫護行業在未來會被AI淘汰嗎?
人工智能·醫療·護理·職業
YuTaoShao7 小时前
【LeetCode 热题 100】131. 分割回文串——回溯
java·算法·leetcode·深度优先
数据与人工智能律师7 小时前
数字迷雾中的安全锚点:解码匿名化与假名化的法律边界与商业价值
大数据·网络·人工智能·云计算·区块链
chenchihwen7 小时前
大模型应用班-第2课 DeepSeek使用与提示词工程课程重点 学习ollama 安装 用deepseek-r1:1.5b 分析PDF 内容
人工智能·学习