llm

带刺的坐椅2 小时前
java·spring·ai·llm·agent·solon
Spring AI 2.0 GA 倒计时:先别急,来看看 Java AI 框架的另一条路2026 年 5 月 28 日,Spring AI 2.0.0 GA 正式发布在即。对于 Java 开发者而言,这无疑是 AI 工程化的一座里程碑。但在你决定 All In 之前,不妨花十分钟,了解一下 Java AI 框架的另一条路。
大模型真好玩3 小时前
人工智能·llm·deepseek
从RAG到LLM Wiki:一文看懂大模型+知识的演进路线大模型帮我们处理了海量文档,但知识依然困在模型的参数里,很难真正“生长”。RAG 技术把文档切片存入向量数据库,提问时快速检索相关片段,看似解决了知识持续注入的难题,可忽高忽低的效果却暴露了一个扎心的事实:知识明明“存”在那里,却好像从未真正“属于”过你。
Fleshy数模6 小时前
人工智能·langchain·llm
玩转 LangChain:从 Prompt 模板到多场景 AI 交互实战在大模型应用开发中,Prompt 工程是核心环节之一,而 LangChain 作为主流的大模型开发框架,为 Prompt 的灵活构建与调用提供了强大支撑。本文将结合实际代码案例,带你从基础 Prompt 模板到少样本(Few-Shot)提示模板,一步步掌握 LangChain 在多场景下的 AI 交互实战技巧。
王_teacher6 小时前
人工智能·llm·nlp·lstm
LSTM 原理详解手动编写LSTM模型代码b站手把手编写lstm模型普通 RNN 有长依赖遗忘问题: 序列很长时,梯度反向传播会梯度消失/梯度爆炸,RNN 记不住很早之前的信息,就像鱼的记忆只有7秒。 LSTM(长短期记忆网络) 就是为了解决:长序列记忆、梯度消失 问题,就像添加一个日记本,将记忆写到本子上。
还是转转7 小时前
人工智能·llm·agent
深入认识 Agent —— 智能体开发框架目录: 用 Copilot 学 Agent —— AI 编程的新范式 深入认识 Agent —— 实现你自己的 Agent 深入认识 Agent —— 智能体开发框架
玖日大大7 小时前
人工智能·语言模型·回归·llm·论文解读·ai agent·ai安全
2026十大LLM研究突破:扩散语言模型挑战自回归、Unicode隐形注入、AI操纵性评估 — 大模型从狂飙走向可控2026年5月,Hugging Face 论文热度榜上十篇高票 LLM 论文指向同一个方向:大模型的核心命题变了。
XLYcmy7 小时前
windows·python·ai·llm·prompt·agent·游戏安全
GameGPT 初赛方案设计 训练入口+主入口十、训练入口# train.pyimport os, json, joblibimport numpy as np
qcx2320 小时前
ai·机器人·llm·agent·具身智能·vla
阿里 RynnVLA-002 源码深度拆解:一个 7B 模型如何同时当机器人大脑和世界模拟器一个 Transformer,两种人格:左手操控机械臂做动作,右手预测下一帧画面。阿里达摩院用 LIBERO 97.4% 的成绩证明这不是玩具。
字节跳动开源1 天前
人工智能·开源·llm
局中局!给 Agent 装上 OpenViking,它们竟然学会了“记仇”和“伪装”?作者|字节跳动 Viking 团队GitHub|github.com/volcengine/…从“单一 ChatBot”到“人与多 Agent 协同”,越来越多的系统开始将 Agent 组织起来,完成更复杂的任务。然而,缺少能够长期协同进化的记忆,协作起来像在经历“初恋 50 次”,它们记不住“谁在过去做了什么”,无法沉淀共同经验,更难在复杂博弈中形成“记仇”、“结盟”或“深度伪装”等高阶群体行为。
不懂的浪漫1 天前
ai·cnn·llm·transformer·rag
从看清到理解:CNN、Transformer 与 RAG 背后的 AI 架构迁徙一个 CV 旧人眼中的模型范式迁移:从视觉识别、语义建模,到外部知识与 Agent 系统。今天很多人一提 RAG,就直接想到向量数据库。这个联想并不奇怪,因为向量数据库确实是 RAG 最常见的基础设施之一。
目黑live +wacyltd1 天前
人工智能·算法·llm·大模型备案·算法备案
算法备案的实操指南(含截图示例)本文目录01 为什么大厂技术出身,更容易踩坑?02 算法备案全景图:你要哪种备案?03 2026年新规重点:数字虚拟人备案全解析
Paraverse_徐志斌1 天前
人工智能·ai·架构·llm·agent·react
【AI Agent】常用架构模式:ReAct、Plan-and-Execute、Reflection为什么需要 Agent 架构模式,在传统 LLM 应用中,大模型通常是根据用户输入直接生成答案,这种方式适合简单问答,但在真实业务场景中往往不够用。
qcx231 天前
算法·ai·llm·agent·rag·agentic
混合检索+重排序:当前 RAG 精度提升最成熟的工程路径RAG 的回答有引用,但引用是真的吗?这篇论文用"混合检索→重排序→保守生成→逐条验证"四步流水线,在生物医疗 QA 上做到了 100% 引用准确率。方法不炫,但管用。
名字不好奇1 天前
人工智能·llm·transformer
大模型如何理解上下文:Attention 机制详解上篇文章留下了一个问题。Embedding 让大模型在高维空间里建立了词与词之间的语义关系——"法国"和"巴黎"靠近,"猫"和"狗"是邻居。但 Embedding 有一个根本缺陷:它只描述词本身,不描述词所处的环境。
组合缺一1 天前
java·人工智能·ai·llm·agent·solon·agentscope
agentscope-harness vs solon-ai-harness:Java 智能体「马具引擎」的双雄对决2026 年,Java AI 智能体开发领域正在经历一场「运行时层」的竞赛。阿里系的 AgentScope Java 和杭州无耳的 Solon AI 框架,分别交出了各自对「AI Agent Harness」的理解答卷。本文从架构设计、功能覆盖、开发者体验三个维度,对两者进行深度对比分析。
冬奇Lab2 天前
人工智能·llm
RAG 系列(十五):CRAG——检索结果不好时自动纠偏前面几篇优化了检索质量:更好的分块、更精准的排序、更聪明的问法。但有一个根本性的问题一直被回避:如果知识库本来就没有这个问题的答案呢?
kyriewen2 天前
前端·react.js·llm
老板逼我上AI,我偷偷在浏览器里跑LLaMA,省下20万API费老板看了竞品,眼睛发光:“我们也上AI!用户问啥都得秒回!” 我默默算了算OpenAI的账单——一个月2万,一年24万,够全组去三亚团建三次。于是我干了件疯狂的事:把AI模型塞进用户浏览器里。不用服务器,不花一分钱API,用户电脑自己跟自己聊天。老板看着账单上的“0”,问我是不是偷偷充了值。
龙侠九重天2 天前
人工智能·深度学习·架构·大模型·llm·deepseek·deepseek v4
DeepSeek V4 深度解析:从架构创新到开发者生态的全面解读值得注意的是,DeepSeek 宣布 deepseek-chat 和 deepseek-reasoner 将于 2026年7月24日停用,前者将迁移到 V4-Flash 的 non-thinking 模式,后者迁移到 thinking 模式。
厚国兄2 天前
人工智能·llm·agent
Agent 工程化系列 · 第 06 篇_MCP是什么协议从工具接入到上下文标准化,讲清 Agent 如何连接外部世界。这一篇继续沿着 Agent 工程化系列往下走。前两篇我们把 LLM、Agent、Workflow 的边界讲清楚;第 04、05 篇讲了 Function Call 是什么,以及它在底层如何把“自然语言意图”变成“结构化工具调用”。
带刺的坐椅2 天前
java·ai·llm·solon·agentscope·harness
agentscope-harness vs solon-ai-harness:Java 智能体「马具引擎」的双雄对决2026 年,Java AI 智能体开发领域正在经历一场「运行时层」的竞赛。阿里系的 AgentScope Java 和杭州无耳的 Solon AI 框架,分别交出了各自对「AI Agent Harness」的理解答卷。本文从架构设计、功能覆盖、开发者体验三个维度,对两者进行深度对比分析。