SpringAI+DeepSeek大模型应用开发——1 AI概述

AI领域常用词汇

LLM(LargeLanguage Model,大语言模型)

能理解和生成自然语言的巨型AI模型,通过海量文本训练。例子:GPT-4、Claude、DeepSeek、文心一言、通义干问。

  • G(Generative)生成式: 根据上文预测之后应该出现哪个文本,从而形成连续的文本输出

  • P(Pre-trained)预训练: 通过大规模的文本数据进行预训练,让大模型可以理解人类语言的语法、词性。

  • T(Transformer)Transformer: 深度学习的一种神经网络模型。多数AIGC模型都依赖于此

感知能力:海量文本训练,接收用户输入文本,,PDF,图片==>OCR==>转成文本,但是会损失很多信息,如颜色布局,色调等

机器学习

基于数据,通过统计和优化方法训练模型。包括监督学习、无监督学习和强化学习等子领域。应用: 游戏AI、推荐引擎

深度学习(DeepLearning)

解释:模仿人脑神经网络结构的机器学习方法,需要大量数据和算力。

例子:图像识别、语音转文字。

神经网络(NeuralNetwork)

解释:由多层"虚拟神经元"组成的计算模型,AI学习的基础架构。

NLP(NaturalLanguageProcessing,自然语言处理)

解释:让计算机理解、生成人类语言的技术。

应用:机器翻译、情感分析。

多模态(Multimodal)

能同时处理文本、图像、语音等多种类型数据的AI。

例子:GPT-4V 可以分析图片内容并回答问题。

  1. 视觉感知:端到端视觉感知,输入图片,直接能获取所有信息

  2. 多模态感知:包括声音语气语调,视频时序等信息

  3. 推理能力:利用CoT和ToT思维链,模型思考问题前,进行问题拆解

  4. 工作流+多智能体:各个AI各司其职协作完成任务,缺点是任务分工还是人为定好的

  5. 模型即Agent-深度搜索:模型自主决定什么时候搜索或整理信息

检索增强生成(RAG)

对大型语言模型输出进行优化,使其能够在生成响应之前引用训练数据来源之外的权威知识库

例子:RAG广泛应用于各种自然语言处理任务,包括问答系统、知识图谱构建、智能客服等,能够显著提升大模型在实际业务场景中的表现。

更多更专业的名词可参考Spring AI Alibaba 项目的介绍:Chat Client,里面有可运行的代码,工具(Function Calling) 向量存储(Vector Store)

AI Agent

Agent直译过来就是代理,结合AI来看就是 智能体,核心:实现AI自主完成任务==>收到任务指令==>感知环境+独立思考+主动实践

行动能力

  1. 初级-大模型函数调用:模型感觉要调用某个工具==>生成一段API调用文本==>过滤器识别==>找到对应的功能函数去调用==>返回答案

  2. 训练模型控制浏览器(manus操作网页来源)

  3. MCP模型上下文协议:统一各个API工具接口的格式,比如股票接口和计算器接口 都有TypeC格式去接入模型

记忆能力

  1. 增加上下文长度

  2. RAG(检索增强生成)==>延长模型对话记忆==>中途总结前面的对话+偶尔回顾==>记忆模块

  3. DeepSeek稀疏注意力机制

manus

  1. 规划+工具==>生成待办事项todo

  2. 调用搜索工具搜索网页,待办事项打勾

DeepSeek
  • 基础模型(V3):通用模型,高效便捷,适用于绝大多数任务, " 规范性"任务 ,聪明且听话

  • 深度思考(R1):文本推理模型,复杂推理和深度分析任务,如数理逻辑推理和编程代码,聪明但不听话

  • 联网搜索:RAG(检索增强生成),知识库更新至24年7月

如何提问?

  • 基础模型(V3):"过程-结果"清晰(指令)

  • 深度思考(R1):目标清晰,结果可以模糊(推理)

提示词结构

  1. 定义AI的角色: 经验丰富的数据分析师 具备十年销售经验的SaaS系统商务

  2. 期望达成什么目标效果: 通过该文案吸引潜在客户,促成消 费......通过该报告为相关企业管理 者提供......策略支撑

  3. 具体任务描述: 写一份关于XXX活动的小红书宣推文案 写一份关于XX事件的舆论分析报告 (XX活动/事件相关背景信息如下......)

  4. Objective(操作要求) 字数要求、段落结构、用词风格、 内容要点、输出格式...

Manus能力

  1. 展示窗口

  2. 调用搜索工具

  3. 浏览网页

  4. 命令行

  5. 多轮搜索

  6. 编程和部署

Spring AI

一个大模型应用框架。目标:将人工智能领域无缝接入Spring 生态体系,快速改造传统项目

为什么选择 SpringAI?

目前大模型应用开发最常见的框架就是LangChain,然而LangChain是基于Python语言,虽然有LangChain4j,但是对于大量使用Spring生态的应用来说,适配性就稍微差了些;

而Spring公司推出的SpringAI框架,充分利用了Spring框架中AOP、IOC的能力,可以与现有的Java项目无缝融合,非常方便;

  • JDK版本至少是JDK17,SpringBoot也必须是3.x的版本;

  • 如果是比较老的项目,也可以考虑采用LangChain4j,它要求的最低JDK版本为JDK8。

  • SpringAI官方文档:Spring AI Reference

相关推荐
小鸡吃米…6 分钟前
机器学习 - K - 中心聚类
人工智能·机器学习·聚类
好奇龙猫44 分钟前
【AI学习-comfyUI学习-第三十节-第三十一节-FLUX-SD放大工作流+FLUX图生图工作流-各个部分学习】
人工智能·学习
Boilermaker19921 小时前
[Java 并发编程] Synchronized 锁升级
java·开发语言
沈浩(种子思维作者)1 小时前
真的能精准医疗吗?癌症能提前发现吗?
人工智能·python·网络安全·健康医疗·量子计算
minhuan1 小时前
大模型应用:大模型越大越好?模型参数量与效果的边际效益分析.51
人工智能·大模型参数评估·边际效益分析·大模型参数选择
Cherry的跨界思维1 小时前
28、AI测试环境搭建与全栈工具实战:从本地到云平台的完整指南
java·人工智能·vue3·ai测试·ai全栈·测试全栈·ai测试全栈
MM_MS1 小时前
Halcon变量控制类型、数据类型转换、字符串格式化、元组操作
开发语言·人工智能·深度学习·算法·目标检测·计算机视觉·视觉检测
ASF1231415sd1 小时前
【基于YOLOv10n-CSP-PTB的大豆花朵检测与识别系统详解】
人工智能·yolo·目标跟踪
alonewolf_992 小时前
JDK17新特性全面解析:从语法革新到模块化革命
java·开发语言·jvm·jdk
一嘴一个橘子2 小时前
spring-aop 的 基础使用(啥是增强类、切点、切面)- 2
java