ai agent

Mininglamp_271817 小时前
后端·开源·多智能体·ai agent·mano-p
Vibe Coding 之后是 Vibe Operating?Vibe Coding 这个词从 Andrej Karpathy 嘴里说出来之后,几个月内就变成了开发者圈子里的日常用语;用自然语言描述需求、让 AI 生成代码、跑起来看效果——整个编程工作流正在被重新定义。但有一件事在 Vibe Coding 的叙事里被跳过了:开发者每天的工作不只是写代码,还有大量时间花在操作各种桌面应用上,从 Figma 里复制设计规范、到 Jira 里更新任务状态、到 Slack 里同步进度、再到各种内部系统里翻数据。这些操作不涉及代码,却占据了工作日的相当比例。
带娃的IT创业者21 小时前
人工智能·github·开源项目·ai agent·智能体·自我进化
GitHub 热门: coleam00/Archon —— 当 AI Agent 学会自我进化在当下的 AI 开发领域,“Agent”(智能体)无疑是最高频的关键词。然而,许多开发者在实际构建 Agent 应用时,往往会陷入一个困境:我们花费大量精力编排 Prompt、设计工具调用链,最终得到的却是一个行为模式固化、难以应对复杂变化的"脚本执行器"。一旦业务逻辑发生微小的偏移,或者数据结构出现新的变体,我们往往需要重新修改代码。
DogDaoDao2 天前
人工智能·深度学习·程序员·github·ai agent·智能体·agent skill
【GitHub】 Headroom 深度解析:AI Agent 上下文压缩层的完整技术拆解一句话总结:Headroom 是一个在 LLM 收到内容之前自动压缩上下文的本地优先压缩层,通过 6 种自适应算法配合可逆缓存(CCR)机制,实现 60-95% 的 Token 削减,且回答质量零损失。
暗黑小白2 天前
人工智能·架构·ai agent
第二篇:不碰模型,意图识别快 9 倍 —— P0→P1→P2 流水线设计优化的最高境界不是换更强的模型,而是让该做的事情不需要模型来做。全量 LLM function calling:每次把所有 tool schema(5 个工具 × ~150 字描述)传给 Qwen,LLM 读完所有描述再抉择。我们用 qwen-turbo 实测了 500 次(50 条 query × 10 repeats):p50=477ms、p95=672ms、p99=1200ms。延迟分解:input token 编码(~730 tokens) + LLM 推理 + output token 解码(~
跟风舞烟学编程2 天前
人工智能·ai agent·hermes agent·自进化 agent
Hermes Agent 从入门到企业实战-01:Hermes-Agent核心架构🎯 本章目标:读完这一章,你就能跟别人讲清楚 Hermes Agent 是个什么东西,它凭什么 2 个月涨到 5 万星。
暗黑小白2 天前
架构·ai agent
第六篇:本地模型选型 —— 4 个模型 × 2 种设备 × 2 项任务的全量对比选模型不是找"最强"的那个,是找"刚好够用且最省资源"的那个。两个延迟敏感路径:工具选择要求 <100ms,信息提取要求 <500ms。云端 API 的 p99 延迟抖动(500ms+)不可接受。另外本地模型零 API 成本——每天 1 万次工具选择,不用模型 = 每年省 ¥2,800-¥8,500。
暗黑小白2 天前
架构·ai agent
第五篇:Reranker 与 BM25 —— 在精排提升与降级可靠性之间划一条线Reranker 的价值被普遍高估,BM25 的兜底能力被普遍低估——两者都需要你自己的数据来验证。学术界和社区普遍认为 Reranker 显著提升 Faithfulness(+17%),但在我们的 8 条测试用例上只加了 0.7%。
暗黑小白2 天前
架构·ai agent
第十篇:纠纷协调与可观测性 —— 多Agent协作的全链路追踪当三个 Agent(买家、卖家、平台)各有各的立场,你需要的不只是 LLM,还有全链路可观测。买家投诉"收到货坏了",卖家说"发货时是好的"。单一 Agent 会有偏见。
暗黑小白2 天前
架构·ai agent
第三篇:RAG 的三个盲区 —— 混合检索 + 图增强的渐进式进化RAG 不是一个技术选型问题,而是一个渐进式的问题发现过程——你只有上线后被用户怼了,才知道自己漏了什么。
暗黑小白2 天前
python·安全·架构·ai agent
第八篇:人在回路与内容安全 —— 当 AI 说“让我请示一下“Human-in-the-loop 看起来只是一个"审批按钮",背后是一整套状态机、超时策略和框架 hack。
暗黑小白2 天前
架构·ai agent
第一篇:客服Agent 四层架构 —— 一个多Agent客服系统的设计全貌好的架构不是设计出来的,是被问题逼出来的。本文以 5 个关键的架构决策为主线,串起整个系统的设计。电商客服 Agent 和通用RAG问答系统看起来很像——都是一个对话框。大多数团队的自然起步是搭一个标准 RAG 问答系统:文档切片 → 向量嵌入 → 语义检索 → LLM 生成。但在客服场景下,这个通用RAG问答系统方案有四个致命缺陷:
暗黑小白2 天前
架构·ai agent
第四篇:HNSW 参数调优 —— efSearch 从默认 50 降到 32 的完整消融实验默认参数是给"通用场景"的,你的场景需要自己的数据说话。Faiss HNSW 和 Milvus HNSW有本质差异,以下两点是 Milvus 特有、Faiss 不存在的:
暗黑小白2 天前
架构·ai agent
第九篇:降级矩阵与 Token 限流 —— 生产系统的八道防线生产系统不是在"一切正常"时体现价值的,是在"一切都在崩"的时候。如第一篇决策5所述的最坏情况推演(Qwen API 超时 + Milvus OOM + Redis 断连 + BGE Embedding 挂了 + NebulaGraph 不可用),系统能退化到"Qwen2.5-1.5B-Instruct 本地 GPU 推理,无 RAG 增强直接回答"。不是完美的回答,但不是 500。基于这个推演,我们为此设计了以下八维降级矩阵。
深色風信子3 天前
agent·ai编程·ai agent·agentscope
SpringBoot 集成 AgentScope Java
星野云联AIoT技术洞察3 天前
ai agent·技术方案·mcp·ag-ui·平台架构·命令确认·iot设备控制
AG-UI 在 IoT 控制台里怎么落地:设备状态、命令确认与人机协同AG-UI 落到 IoT 控制台时,最重要的不是让 Agent 在页面上“会聊天”,而是让设备状态、建议动作、命令确认、执行结果和失败回滚都能被用户看见和打断。如果一个 IoT 控制台只把 AG-UI 当作聊天消息流,Agent 可能会解释得很好,但真正危险的设备动作仍然缺少状态边界、人工确认和审计证据。
小沈同学呀4 天前
ai agent·工具调用·spring ai·mcp clien·实战演示
SpringAI+MCPClient实战-MiniMax模型打造智能AIAgent各位好,上一篇我们聊了 MCP Server 端的架构设计和实战代码,今天来聊聊 MCP Client 端。在实际项目中,MCP Client 才是真正面向用户的 AI 应用核心,它负责连接各种 MCP Server,自动发现并调用工具,让大模型具备"动手"的能力。
zyk_computer4 天前
人工智能·后端·python·ai·架构·agent·ai agent
AI Agent ,让循环收敛的那套闭环控制系统循环是 agent 区别于 chatbot 的形式特征,但循环本身没有任何含量:这几行代码很容易。2023 年的 AutoGPT 它有当时最华丽的循环。但那一代 scaffold 集体退场,退场不是循环写得不好,而是循环里跑的东西在发散。
IPHWT 零软网络4 天前
架构设计·ai agent·企业通信
从PBX到IP-PBX:基于SIP协议的企业通信架构演进与AI集成实践作为一名长期关注企业通信架构的IT从业者,我见证了从传统PBX到现代IP通信的完整变迁。对于中小企业而言,2026年是一个关键的分水岭——传统的电路交换技术已无法满足数字化转型的需求。
DogDaoDao4 天前
深度学习·程序员·大模型·github·ai agent·agent skill
【GitHub】last30days-skill 深度技术解析核心金句:“Google aggregates editors. /last30days searches people.” —— 这句话道出了整个项目的设计哲学。
取个鸣字真的难5 天前
多智能体·ai agent·claude code
OpenYabby 深度解读:一个语音驱动的开源多智能体项目执行系统项目地址:https://github.com/OpenYabby/OpenYabby 官网:https://openyabby.com/ 适合读者:AI Agent 研究者、开发者、自动化工具爱好者、希望本地部署智能体系统的用户