spring ai

Ting-yu11 小时前
java·spring·spring cloud·spring ai
Spring AI Alibaba零基础速成(3) ---- ChatClient使用ChatModel 是 SpringAI 的底层核心接口,它定义了所有大模型统一的调用规范,是最原始、最基础的调用层。
海兰13 小时前
java·人工智能·spring boot·spring ai
【第54篇】Graph + Langfuse 可观测性实战🙅‍♀️:正在构建 AI Agent 应用、关心"我的图节点到底在干什么"的 Java 开发者。传统的 Spring Boot 应用打日志就够了,但 AI 应用不同——一次用户请求可能要经过 5~7 个图节点,每个节点都在和大模型对话。如果某个节点"卡住了"或者"胡说八道了",你很难从一堆日志里找出罪魁祸首。
小小工匠3 天前
rag·spring ai·热词统计
Spring AI RAG - 07 AOP 日志记录与热词统计知识库系统的运营离不开两类数据:用户在问什么(热词分析)、系统在做什么(操作日志)。前者帮助优化知识库内容,后者用于审计和排障。
小小工匠3 天前
rag·spring ai·websearch
Spring AI RAG - 14 网络检索增强:Web Search 集成RAG 系统的知识范围天然受限于已上传的文档。如果用户问的是"今天的股市行情"或"最新版本的 Spring AI",再完美的内部知识库也无能为力——这些信息根本没有被入库过。
小小工匠3 天前
spring ai·来源追溯
Spring AI RAG - 10 来源追溯:自定义 Advisor 实现“AI 说的对吗?我能在哪里查证?”——这是知识库系统用户最常问的两个问题。一个回答如果没有来源,就只能算大模型的"自由发挥",可信度大打折扣。
恼书:-(空寄5 天前
spring ai·会话记忆
Spring AI实战|ChatMemory Advisor记忆优化:Redis + Kryo持久化方案在Spring AI多轮对话开发中,有一个高频痛点:LLM天然无状态,无法记住上下文。该框架下提供的ChatMemory体系的核心接口,就是解决这个问题;而ChatMemory Advisor(记忆顾问)则是“无感记忆”的关键,它能自动拦截对话请求、注入历史上下文、保存新消息,无需手动处理会话状态。
中间件XL7 天前
ai agent·calling·spring ai·springaialibaba·skills
ai-agent框架spring ai/alibaba原理源码分析(三) 外部调用III-skillsspring ai alibaba是java的ai agent框架,本系列将深入剖析 Spring AI Alibaba 的源码实现与核心原理,不仅指导agent的开发,更可以改造框架,增加新特性,贡献Spring AI Alibaba的发展。
大龄码农有梦想9 天前
spring ai·crewai·多智能体协作框架·spring ai阿里巴巴·spring ai aliba·java智能体框架·python智能体框架
Spring AI Alibaba和CrewAI:多智能体开源框架对比与选型随着 AI 智能体技术的快速发展,多智能体协作和工作流编排已成为构建复杂 AI 应用的核心能力。在当前的技术生态中,CrewAI作为 Python 生态的领军者,以其“人类团队协作” 的设计理念和简洁的 API 赢得了广泛关注;而Spring AI Alibaba则作为 Java 生态的后起之秀,凭借其深度融合 Spring 生态的企业级特性和强大的 Graph 编排引擎,正在迅速崛起。
海兰10 天前
人工智能·spring boot·学习·spring·spring ai
【第39篇】spring-ai-alibaba-graph-example学习路径概览spring-ai-alibaba-graph-example这个项目有 18 个子模块,我按难度分成 5 个级别:
海兰12 天前
人工智能·spring boot·微服务·架构·spring ai
【第35篇】文本摘要微服务一个基于 Spring AI Alibaba 框架的文本摘要微服务,核心能力:代码总量仅 4 个文件,完美演绎“最小可行 AI 服务”的构建范式。
梵得儿SHI13 天前
java·ci/cd·docker·云原生·kubernetes·容器化·spring ai
(第三篇)Spring AI 架构设计与优化:容器化与云原生部署,基于 K8s 的 AI 应用全生命周期管理大家好,我是深耕 Spring AI 架构的后端开发。在这个系列的前两篇文章里,我给大家分享了万级 QPS 分布式架构搭建、全链路可观察性体系落地的实战经验。但架构和监控搭完,真正的线上运维难题才刚刚开始:本地能跑的 AI 服务,到线上就因为环境不一致报错;高峰期要扩容,手动装 JDK、配环境搞了半个多小时,错过了流量峰值;发布新版本要一台台重启虚拟机,回滚慢、风险高,还经常出现 “一半成功一半失败” 的尴尬局面。
行者-全栈开发13 天前
claude·通义千问·spring ai·企业级开发·chatmodel·大模型 api·多模型切换
GPT-4 vs Claude vs 通义千问:Spring AI 接入三大模型对比测评(2026最新)💡 摘要: 本文深入讲解 Spring AI 中 ChatModel 的核心原理和实战应用,涵盖 OpenAI GPT-4/3.5、Anthropic Claude、阿里通义千问等主流大模型的接入配置。通过详细对比各模型的性能、成本、适用场景,提供企业级模型选型指南。包含完整的多模型切换实现、8 个常见问题的解决方案,是构建生产级 AI 应用的必备技术指南。
海兰14 天前
人工智能·spring boot·状态模式·spring ai
【第32篇】场景示例项目本项目演示如何同时向多个 AI 模型(本地 Ollama 与云端 DashScope)发起请求,并将各自流式生成的回复实时推送到前端。用户可以像同时咨询多个专家一样,看到不同模型的观点逐词“生长”出来。后端基于 Spring AI Alibaba 和 Spring WebFlux,前端使用 Next.js + Ant Design X,通过 Server-Sent Events (SSE) 实现单向实时推送。
海兰15 天前
人工智能·spring boot·alibaba·spring ai
【第27篇】Micrometer + Zipkin从零开始,手把手教你用 Spring AI Alibaba + Micrometer + Zipkin 搭建完整的 AI 应用可观测体系。无需阿里云 ARMS,完全开源免费。
海兰15 天前
人工智能·spring boot·alibaba·spring ai
【第28篇】可观测性实战:LangFuse 方案详解手把手教你为 AI 应用接入专有的可观测平台,追踪每一次模型调用、Token 消耗与成本。在前文中,我们分别介绍了 ARMS(阿里云商业方案,需挂载 Java Agent)和 Zipkin(开源通用链路追踪,基于 Micrometer + Brave)。这两个方案都能帮我们“看到” AI 应用内部发生了什么,但它们并不是为 AI 场景量身定做的——比如,你无法直接看到某次对话消耗了多少 Token、花了多少钱。
一叶飘零_sweeeet16 天前
java·面试·spring ai
2026 年 Java 面试必问:Spring AI 核心原理,90% 人答不全Spring AI 已经成为 2026 年 Java 后端面试的必考点,几乎所有中高级岗位都会问到。但绝大多数开发者只会写几行调用大模型的代码,对其底层原理一无所知,面试时一问就卡壳。
海兰17 天前
java·人工智能·spring·spring ai
【开篇】Spring AI、OpenClaw 和HermesSpring AI、OpenClaw 、Hermes它们的差异主要体现在三个方面:到这里,三款工具的选择逻辑也就清晰了。
@SmartSi17 天前
spring ai·mcp
Spring AI 实战:如何使用 MCP Server 搭建 MCP 天气查询服务想象一下,你正在开发一个智能出行助手。用户问:“我明天去北京出差,需要带伞吗?” 大模型本身没有实时数据,它的知识截止于训练日期,无法知道明天的天气预报。这时候,你的 AI 需要一个 工具(Tool) 来获取实时天气。
行者-全栈开发17 天前
openai api·错误处理·密钥管理·spring ai·企业级开发·请求封装·api 安全
Spring AI + GPT-4 实战:API Key 安全管理与企业级集成方案(避坑指南)💡 摘要: 本文深入讲解 Spring AI 项目中 OpenAI API 集成的企业级实践,涵盖 API Key 安全管理策略、统一请求封装组件、完整错误处理机制等核心内容。通过对比硬编码、配置文件、环境变量、密钥管理服务等多种方案,提供生产级的密钥管理最佳实践。包含完整的代码示例和 8 个常见安全问题的解决方案,是企业级 AI 应用开发的必备指南。
@SmartSi18 天前
spring ai·mcp
Spring AI 实战:如何使用 MCP Client 接入 MCP 天气查询服务上一篇文章,我们搭建了一个 MCP 天气服务(Server),它运行在 localhost:8888,对外暴露了 get_weather 工具。但 Server 本身不会说话——它只会安静地等待被调用。