长路的AI领域技术博客汇总文档

文章目录

前言

博主介绍:✌目前全网粉丝4W+,csdn博客专家、Java领域优质创作者,博客之星、阿里云平台优质作者、专注于Java后端技术领域。

涵盖技术内容:Java后端、大数据、算法、分布式微服务、中间件、前端、运维等。

博主所有博客文件目录索引:博客目录索引(持续更新)

CSDN搜索:长路

视频平台:b站-Coder长路

AI后端技术博客汇总文档

0)AI理论基础篇

1)AI模型篇

本地化部署

文章链接 文章内容
LM Studio 本地部署大模型 详解如何在Mac(M1/M2/M3/M4)用LM Studio零配置本地运行Llama、DeepSeek、Qwen等开源大模型,支持MLX极速格式与OpenAI兼容API,16GB内存即可流畅体验,全程离线保护隐私。
部署模型平台选型指南:LM Studio vs Xinference 对比LM Studio与Xinference在大模型商业部署中的许可证、性能与扩展性差异,指出LM Studio因禁止大规模商用及缺乏生产级功能而不适合商业场景,Xinference凭借Apache 2.0协议与分布式架构成为企业安全高效部署开源大模型的首选,同时提醒务必审查模型许可证以确保合规。

2)AI应用篇

向量数据库

文章链接 文章内容
Milvus向量库Java对接使用指南 系统梳理Milvus向量数据库的核心概念与实战技巧,涵盖Collection Schema设计、索引类型选型、内存估算、过滤/分组/混合搜索调优及MilvusClientV2升级注意事项,助力高召回低延迟的向量检索落地。

ai框架

langchain4j(Java实现)
文章链接 文章内容
01、LangChain4j 系统化知识学习笔记(接入模型、AiService、持久化记忆、增强RAG) LangChain4j简化大语言模型与Java集成,支持多种大模型,提供便捷API,助力智能应用开发。
02、Langchain4j tools原理与核心实践(含自定义http插件) 本文详解LangChain4j中Function Calling的四种实现方式:注解快速集成、手动注册Tools、自定义ToolSpecification及HTTP插件扩展。涵盖Spring Boot整合、源码原理剖析与Serper搜索插件实战,提供完整代码示例与前端对接方案,助力开发者构建具备工具调用能力的AI智能体。
03、LangChain4j的stream流式tool前后机制调用 深入解析LangChain4j流式调用场景下的Tool工具调用机制,涵盖AiServiceStreamingResponseHandler执行逻辑、同步/异步执行模式、beforeToolExecutionHandler与toolExecutionHandler前后钩子处理流程及Handler初始化机制。
04、LangChain4j快速对接VL视觉理解模型 本文详细介绍了如何使用LangChain4j框架对接阿里云qwen3-vl-plus视觉理解模型,支持图片URL和本地文件两种多模态交互方式,包含完整的Java代码示例与iflow平台免费模型调用实践。
langchain(Python实现)

实战项目篇

文章链接 文章内容
langchain4j+ai模型 硅谷小智 智慧医疗实战项目案例 本文详细讲解基于Java+LangChain4j框架构建医疗AI智能体硅谷小智的完整实现,涵盖通义千问模型接入、MongoDB记忆持久化、Function Calling预约功能、Pinecone向量数据库RAG增强及流式输出等核心技术,提供从0到1的企业级大模型应用开发实战指南。

3)Agent中间层实现篇

理论篇

文章链接 文章内容
何为ReAct模式 & Plan+Act框架 深度解析Manus多智能体框架如何借ReAct模式破解复杂任务"工具乱舞"难题,实现Thought-Act-Observation循环,端到端成功率提升4-6倍,并给出LangChain4j落地示例与开源替代方案。

开源项目学习

造轮子篇

通用Agent设计:ReAct Agent设计
文章链接 文章内容
长任务场景下 ReAct Agent 的可靠终止机制设计与实现 本文深入剖析ReAct框架的历史设计缺陷,提出通过封装FinishTool优化长任务停止判断机制。详细讲解系统提示词设计、AI消息检测逻辑及AgentSettings参数配置,帮助开发者解决AI Agent在长任务场景中无法可靠终止的问题。

资料获取

大家点赞、收藏、关注、评论啦~

精彩专栏推荐订阅:在下方专栏👇🏻

更多博客与资料可查看👇🏻获取联系方式👇🏻,🍅文末获取开发资源及更多资源博客获取🍅

相关推荐
qq_2837200513 小时前
私有知识库 RAG 搭建:内网文档智能问答解决方案
向量数据库·检索·私有rag
带刺的坐椅3 天前
Java AI 框架三国杀:Solon AI vs Spring AI vs LangChain4j 深度对比
java·ai·langchain4j·spring-ai·solon-ai
程序员老邢3 天前
【技术底稿 31】Milvus 2.5.14 实战避坑实录:字段缺失、行数不匹配、Metadata JSON 类型三连坑完整解法
milvus·向量数据库·rag·技术底稿·踩坑实录·37岁老码农
七牛云行业应用3 天前
GPT-5.5 Instant vs Grok 4 完整对比【2026年5月最新】:哪个大模型更适合开发者?
人工智能·docker·github·ai实战·大模型部署·claude opus 4.7·api接入
冲上云霄的Jayden3 天前
面向 FAQ、流程文档、规则文档的 RAG 处理方案
metadata·chunk·rag·语义搜索·向量化·faq·langchain4j
Rabbit_QL4 天前
【大模型换机器部署失败原因排查】一次 `Illegal instruction` 排查:原来是虚拟机没暴露 AVX 指令集
大模型部署
奋斗的老史4 天前
LangChain4j 进阶实战系列
java·langchain4j·ai应用开发
AAI机器之心9 天前
在 macOS 上本地部署 Ollama + LLaMA3(附教程)
人工智能·macos·langchain·llm·知识库·大模型部署
小编码上说10 天前
LSH(局部敏感哈希)分桶,海量数据下的相似性搜索解决方案
java·spring boot·缓存·langchain4j·lsh·局部敏感哈希·ai调用优化
qq_2837200518 天前
Chroma 向量数据库详细介绍与实战全攻略
数据库·人工智能·向量数据库·chroma