llm

嘻嘻仙人2 小时前
llm·agent
Python 开发者的性能革命:为什么你应该从 pip 转向 uv?在 Python 的世界里,长期以来我们依赖 pip 和 venv 进行依赖管理。然而,随着项目规模的扩大,这些传统方法在处理依赖冲突、安装速度和环境碎片化上逐渐显得力不从心。uv 的出现,不仅是一个工具的升级,更是 Python 工程化开发的一次效率革命。
universeplayer2 小时前
llm·agent
我给 AI Agent 装了个飞机黑匣子:录下每一次 LLM 调用,崩了能确定性回放做 Agent 做久了,你一定会撞上这样一个晚上。线上跑得好好的系统,某个用户来反馈:「它今天给我的回答很奇怪。」你打开日志,把同样的输入再喂一遍想复现。结果这次它表现得完全正常。再跑一遍,还是正常。那次真正出问题的运行,像从来没发生过一样,你怎么都抓不回来。
JieE2122 小时前
人工智能·llm·ai编程
从"无状态"到"懂你":深入理解 LLM 对话的本质,以及 Prompt/Context/Loop 三层工程进化之路每次和大模型聊天,它为什么能"记住"你上一句说了什么?你真的理解背后的"无状态"原理吗?先来看一段简单的代码:
Lkstar2 小时前
人工智能·llm
Function Calling 原理深度拆解:让 LLM 调用外部工具的机制与工具设计原则导读:Function Calling 是大模型从"聊天机器人"进化为"智能体引擎"的底层基建。本文从原理层面拆解它的工作机制,并结合真实踩坑经验,系统梳理工具描述、参数规范、错误处理三大设计原则。
Hyyy14 小时前
程序员·llm·ai编程
token是什么?为什么大模型会有上下文长度的限制Token 是大语言模型(LLM)处理文本时的最小单位。模型不会直接识别汉字、英文字母,它处理文本有自己的最小颗粒度,这个颗粒就叫 Token。所有的语义理解、内容生成都建立在 Token 的基础上,不会拆得比 Token 更小。
阿里云云原生18 小时前
llm
软件工程领域 LLM 驱动的自迭代知识引擎不是把通用知识管理工具硬搬进代码场景,而是从设计之初就面向软件工程——理解代码、贴合研发流程,并且能嵌入企业现有工具链、真正用起来。
吴佳浩18 小时前
人工智能·llm·agent
Hermes Agent 连环 400 真凶找到了:一个 call_id 让人炸毛作者:吴佳浩撰稿时间:2026-06-21最后更新:2026-06-22这两天排查 Hermes 的一个 Bug,差点把我绕进去。
武子康2 天前
人工智能·langchain·llm
调查研究-186 LangChain 和 LangGraph 的区别:从快速构建 Agent 到生产级工作流编排摘要:LangChain 和 LangGraph 不是"谁替代谁"的关系,而是站在不同抽象层级解决不同问题。LangChain 更像 LLM 应用开发框架,负责模型、Prompt、工具、Retriever、Agent、Middleware 等组件抽象,让开发者快速把大模型能力接进应用。LangGraph 更像 Agent runtime / 工作流编排引擎,负责 State、Node、Edge、条件跳转、checkpoint、interrupt、人类介入、持久化和失败恢复。本文从工程选型视角拆解二者差异、
JouYY2 天前
前端框架·llm·agent
简单聊一下Harness层中的人机协同(HITL)因为业务涉及很多资产和金额相关的操作,如果把所有能力直接开放给Agent,很容易造成资损,所以涉及高风险的操作,都必须需要人来确认,这个确认要求,不是Agent自己发起,而是由Harness层做的限制。
AINative软件工程2 天前
llm·openai·agent
LLM 应用的 Bad Case 反馈闭环工程:别再把用户差评丢进客服表了如果你做过线上 LLM 应用,大概率遇到过这种场景:用户点了一个 👎,备注里写着“答非所问”。客服系统里多了一条工单,产品同学截图发到群里,研发看了一眼 trace,发现 prompt、检索、工具调用、模型返回都“看起来没报错”。最后大家讨论半小时,结论是:这个问题不好复现,先观察。
冬奇Lab4 天前
人工智能·llm·agent
Agent 系列(23):Web Agent——让 Agent 真正浏览网页LLM 的知识有截止日期。你问它"LangGraph 最新版本是多少",它只能告诉你训练数据里的版本。Web Agent 解决这个问题:让 Agent 真正上网查,拿到实时数据再回答。
冬奇Lab4 天前
人工智能·开源·llm
每日一个开源项目(第135篇):codebase-memory-mcp - 给 AI Agent 一张代码库的知识图谱"AI Agent 探索代码库时读取每一个文件,消耗 412,000 个 token。换成知识图谱查询,只需要 3,400 个 token。"
黄忠4 天前
python·llm
大模型之LangGraph技术体系适用版本:LangGraph 1.0+(兼容 0.3.x 核心 API) 技术栈:Python 3.10+ / LangGraph / LangChain / SQLite / Redis 定位:聚焦图结构工作流设计与生产级实践
不好听6134 天前
llm·agent
Tool:让大模型长出手脚上一篇文章我们讲了 Agent 的三要素:LLM 是大脑,Tools 是手脚,Messages 是记忆。
Lei活在当下5 天前
人工智能·llm·openai
【AI手记系列-2026/6/18】iSparto & Harness,Caveman 以及AI时代的生存指南原文链接:mp.weixin.qq.com/s/YhsmIXdIv…这篇文章是一名独立开发者的 Harness Engineering 实践记录。作者使用 Claude Code,设计出一套不同角色的 Agent Team,并通过这套 Team 真正完成了 iOS App "勇芽" 的开发与上线。我认为,文中最值得借鉴的是一种组织设计思路:围绕最终目标,为不同任务设置独立角色,再把这些角色组装成一个多职能团队。
冬奇Lab5 天前
数据库·人工智能·llm
每日一个开源项目(第134篇):Zvec - 阿里开源的嵌入式向量数据库,向量搜索界的 SQLite"向量数据库的 SQLite——嵌进应用里跑,不需要外部服务器。"这是"每日一个开源项目"系列的第134篇文章。今天的主角是 Zvec——阿里巴巴通义实验室开源的进程内向量数据库。
得物技术5 天前
大数据·llm·ai编程
从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流在埋点和指标需求里,最消耗数据承接方的往往是 把分散的信息重新拼起来:需求文档里的动作到底要不要采集,历史上有没有类似点位,指标口径有没有被下游使用,新增字段要改哪几层表,发布前又该由谁确认。 我们选择Hermes Agent而不是OpenClaw是因为它具备持续在线、持久记忆和技能沉淀能力。对数据团队来说,下面几个原生能力正好对准了这类流程痛点:
AINative软件工程5 天前
llm
AI Agent 的 Tool Schema 设计工程实践:函数签名写差了,调用成功率能差 30%Mastra 团队在 2025 年测试了 12 个主流模型(涵盖多家国内外大模型厂商)对 30 种 JSON Schema 约束的支持情况,最终把 tool calling 错误率从 15% 压到 3%。核心结论只有一个:Schema 写法不一样,同一个工具在不同模型上的成功率可以相差 5 倍。
柒和远方5 天前
langchain·llm·agent
LangGraph 深度解析:从增强型 LLM 到生产级 Agent你用过 withStructuredOutput,也写过 bindTools,但一旦业务变复杂——多轮工具调用、条件分支、并行请求、人在回路——光靠链式调用就开始力不从心。LangGraph 就是为这个而生的。
冬奇Lab6 天前
人工智能·llm·agent
Agent 系列(21):Harness 测试工程——45 个测试怎么设计,以及它发现了什么 bug普通业务逻辑测试覆盖"应该发生什么",Harness 测试还要覆盖"不应该发生什么":这类负向测试用业务逻辑测试框架很难自然写出来;专门的 Harness 测试套件才是第一公民。