ai agent

doiito19 小时前
ai·rust·架构设计·系统设计·ai agent
【Agent Harness】Gliding Horse 本体论系统设计:给 AI Agent 装上“语义大脑”摘要:本文深入解析 Gliding Horse(流马)AI Agent 操作系统的本体论系统设计。通过 SHACL 形状约束、OWL 推理引擎、本体对齐与漂移检测,为 Agent 产出的每一条 JSON-LD 数据赋予语义一致性和可追溯性。基于 Rust 和 Oxigraph 图存储实现零拷贝推理,让 AI Agent 从"会执行指令"升级为"能理解并演化知识"的认知操作系统。
doiito2 天前
ai·rust·架构设计·系统设计·ai agent
【Agent Harness】为什么我把 JSON‑LD “编译成 DAG” 后,整个 Agent 平台立刻聪明了我写的 Gliding Horse(流马) 是一个用 Rust 从零构建的 AI Agent 操作系统。如果你问我:整个系统里最“魔法”的一个设计是什么? 我会毫不犹豫地回答:把 JSON‑LD 直接编译成 DAG。
xiezhr2 天前
ai·飞书·ai agent·飞书cli·飞书文档
折腾半小时,终于让AI 能直接帮我写飞书文档了前阵子在排查公司内网一个 Java 服务的问题,日志刷了一屏幕。问题定位到了,方案也理清了,于是习惯性对 AI 说:"帮我把分析结果整理一下,写成一个飞书文档。"
DogDaoDao7 天前
人工智能·python·ai·大模型·github·ai agent·cl4r1t4s
【GitHub】CL4R1T4S:AI 系统提示词的透明革命深度解析 GitHub 上近 4 万 Star 的 AI 系统提示词泄露项目——它如何撕开 AI 行为的"黑箱",以及这对整个 AI 行业意味着什么。
Super Scraper7 天前
爬虫·ai·自动化·抖音·tiktok·ai agent
如何批量抓取 TikTok 数据而不被封锁?完整指南TikTok以两个阶段渲染其网页。初始HTML承载一个大JSON岛——一个 <script id="__UNIVERSAL_DATA_FOR_REHYDRATION__"> 大块——其中包含了用户资料、其统计信息以及首个帖子。此后的所有内容(在滚动时更多帖子、评论线程、搜索页面)在页面引导后通过XHR获取。因此,抓取TikTok需要两种技术:读取补充JSON以获取已有内容,捕获XHR响应以加载按需内容。
Mininglamp_27188 天前
后端·开源·多智能体·ai agent·mano-p
Vibe Coding 之后是 Vibe Operating?Vibe Coding 这个词从 Andrej Karpathy 嘴里说出来之后,几个月内就变成了开发者圈子里的日常用语;用自然语言描述需求、让 AI 生成代码、跑起来看效果——整个编程工作流正在被重新定义。但有一件事在 Vibe Coding 的叙事里被跳过了:开发者每天的工作不只是写代码,还有大量时间花在操作各种桌面应用上,从 Figma 里复制设计规范、到 Jira 里更新任务状态、到 Slack 里同步进度、再到各种内部系统里翻数据。这些操作不涉及代码,却占据了工作日的相当比例。
带娃的IT创业者8 天前
人工智能·github·开源项目·ai agent·智能体·自我进化
GitHub 热门: coleam00/Archon —— 当 AI Agent 学会自我进化在当下的 AI 开发领域,“Agent”(智能体)无疑是最高频的关键词。然而,许多开发者在实际构建 Agent 应用时,往往会陷入一个困境:我们花费大量精力编排 Prompt、设计工具调用链,最终得到的却是一个行为模式固化、难以应对复杂变化的"脚本执行器"。一旦业务逻辑发生微小的偏移,或者数据结构出现新的变体,我们往往需要重新修改代码。
DogDaoDao9 天前
人工智能·深度学习·程序员·github·ai agent·智能体·agent skill
【GitHub】 Headroom 深度解析:AI Agent 上下文压缩层的完整技术拆解一句话总结:Headroom 是一个在 LLM 收到内容之前自动压缩上下文的本地优先压缩层,通过 6 种自适应算法配合可逆缓存(CCR)机制,实现 60-95% 的 Token 削减,且回答质量零损失。
暗黑小白9 天前
人工智能·架构·ai agent
第二篇:不碰模型,意图识别快 9 倍 —— P0→P1→P2 流水线设计优化的最高境界不是换更强的模型,而是让该做的事情不需要模型来做。全量 LLM function calling:每次把所有 tool schema(5 个工具 × ~150 字描述)传给 Qwen,LLM 读完所有描述再抉择。我们用 qwen-turbo 实测了 500 次(50 条 query × 10 repeats):p50=477ms、p95=672ms、p99=1200ms。延迟分解:input token 编码(~730 tokens) + LLM 推理 + output token 解码(~
跟风舞烟学编程9 天前
人工智能·ai agent·hermes agent·自进化 agent
Hermes Agent 从入门到企业实战-01:Hermes-Agent核心架构🎯 本章目标:读完这一章,你就能跟别人讲清楚 Hermes Agent 是个什么东西,它凭什么 2 个月涨到 5 万星。
暗黑小白9 天前
架构·ai agent
第六篇:本地模型选型 —— 4 个模型 × 2 种设备 × 2 项任务的全量对比选模型不是找"最强"的那个,是找"刚好够用且最省资源"的那个。两个延迟敏感路径:工具选择要求 <100ms,信息提取要求 <500ms。云端 API 的 p99 延迟抖动(500ms+)不可接受。另外本地模型零 API 成本——每天 1 万次工具选择,不用模型 = 每年省 ¥2,800-¥8,500。
暗黑小白9 天前
架构·ai agent
第五篇:Reranker 与 BM25 —— 在精排提升与降级可靠性之间划一条线Reranker 的价值被普遍高估,BM25 的兜底能力被普遍低估——两者都需要你自己的数据来验证。学术界和社区普遍认为 Reranker 显著提升 Faithfulness(+17%),但在我们的 8 条测试用例上只加了 0.7%。
暗黑小白9 天前
架构·ai agent
第十篇:纠纷协调与可观测性 —— 多Agent协作的全链路追踪当三个 Agent(买家、卖家、平台)各有各的立场,你需要的不只是 LLM,还有全链路可观测。买家投诉"收到货坏了",卖家说"发货时是好的"。单一 Agent 会有偏见。
暗黑小白9 天前
架构·ai agent
第三篇:RAG 的三个盲区 —— 混合检索 + 图增强的渐进式进化RAG 不是一个技术选型问题,而是一个渐进式的问题发现过程——你只有上线后被用户怼了,才知道自己漏了什么。
暗黑小白9 天前
python·安全·架构·ai agent
第八篇:人在回路与内容安全 —— 当 AI 说“让我请示一下“Human-in-the-loop 看起来只是一个"审批按钮",背后是一整套状态机、超时策略和框架 hack。
暗黑小白9 天前
架构·ai agent
第一篇:客服Agent 四层架构 —— 一个多Agent客服系统的设计全貌好的架构不是设计出来的,是被问题逼出来的。本文以 5 个关键的架构决策为主线,串起整个系统的设计。电商客服 Agent 和通用RAG问答系统看起来很像——都是一个对话框。大多数团队的自然起步是搭一个标准 RAG 问答系统:文档切片 → 向量嵌入 → 语义检索 → LLM 生成。但在客服场景下,这个通用RAG问答系统方案有四个致命缺陷:
暗黑小白9 天前
架构·ai agent
第四篇:HNSW 参数调优 —— efSearch 从默认 50 降到 32 的完整消融实验默认参数是给"通用场景"的,你的场景需要自己的数据说话。Faiss HNSW 和 Milvus HNSW有本质差异,以下两点是 Milvus 特有、Faiss 不存在的:
暗黑小白9 天前
架构·ai agent
第九篇:降级矩阵与 Token 限流 —— 生产系统的八道防线生产系统不是在"一切正常"时体现价值的,是在"一切都在崩"的时候。如第一篇决策5所述的最坏情况推演(Qwen API 超时 + Milvus OOM + Redis 断连 + BGE Embedding 挂了 + NebulaGraph 不可用),系统能退化到"Qwen2.5-1.5B-Instruct 本地 GPU 推理,无 RAG 增强直接回答"。不是完美的回答,但不是 500。基于这个推演,我们为此设计了以下八维降级矩阵。
深色風信子10 天前
agent·ai编程·ai agent·agentscope
SpringBoot 集成 AgentScope Java
星野云联AIoT技术洞察10 天前
ai agent·技术方案·mcp·ag-ui·平台架构·命令确认·iot设备控制
AG-UI 在 IoT 控制台里怎么落地:设备状态、命令确认与人机协同AG-UI 落到 IoT 控制台时,最重要的不是让 Agent 在页面上“会聊天”,而是让设备状态、建议动作、命令确认、执行结果和失败回滚都能被用户看见和打断。如果一个 IoT 控制台只把 AG-UI 当作聊天消息流,Agent 可能会解释得很好,但真正危险的设备动作仍然缺少状态边界、人工确认和审计证据。