技术栈
ai agent
doiito
19 小时前
ai
·
rust
·
架构设计
·
系统设计
·
ai agent
【Agent Harness】Gliding Horse 本体论系统设计:给 AI Agent 装上“语义大脑”
摘要:本文深入解析 Gliding Horse(流马)AI Agent 操作系统的本体论系统设计。通过 SHACL 形状约束、OWL 推理引擎、本体对齐与漂移检测,为 Agent 产出的每一条 JSON-LD 数据赋予语义一致性和可追溯性。基于 Rust 和 Oxigraph 图存储实现零拷贝推理,让 AI Agent 从"会执行指令"升级为"能理解并演化知识"的认知操作系统。
doiito
2 天前
ai
·
rust
·
架构设计
·
系统设计
·
ai agent
【Agent Harness】为什么我把 JSON‑LD “编译成 DAG” 后,整个 Agent 平台立刻聪明了
我写的 Gliding Horse(流马) 是一个用 Rust 从零构建的 AI Agent 操作系统。如果你问我:整个系统里最“魔法”的一个设计是什么? 我会毫不犹豫地回答:把 JSON‑LD 直接编译成 DAG。
xiezhr
2 天前
ai
·
飞书
·
ai agent
·
飞书cli
·
飞书文档
折腾半小时,终于让AI 能直接帮我写飞书文档了
前阵子在排查公司内网一个 Java 服务的问题,日志刷了一屏幕。问题定位到了,方案也理清了,于是习惯性对 AI 说:"帮我把分析结果整理一下,写成一个飞书文档。"
DogDaoDao
7 天前
人工智能
·
python
·
ai
·
大模型
·
github
·
ai agent
·
cl4r1t4s
【GitHub】CL4R1T4S:AI 系统提示词的透明革命
深度解析 GitHub 上近 4 万 Star 的 AI 系统提示词泄露项目——它如何撕开 AI 行为的"黑箱",以及这对整个 AI 行业意味着什么。
Super Scraper
7 天前
爬虫
·
ai
·
自动化
·
抖音
·
tiktok
·
ai agent
如何批量抓取 TikTok 数据而不被封锁?完整指南
TikTok以两个阶段渲染其网页。初始HTML承载一个大JSON岛——一个 <script id="__UNIVERSAL_DATA_FOR_REHYDRATION__"> 大块——其中包含了用户资料、其统计信息以及首个帖子。此后的所有内容(在滚动时更多帖子、评论线程、搜索页面)在页面引导后通过XHR获取。因此,抓取TikTok需要两种技术:读取补充JSON以获取已有内容,捕获XHR响应以加载按需内容。
Mininglamp_2718
8 天前
后端
·
开源
·
多智能体
·
ai agent
·
mano-p
Vibe Coding 之后是 Vibe Operating?
Vibe Coding 这个词从 Andrej Karpathy 嘴里说出来之后,几个月内就变成了开发者圈子里的日常用语;用自然语言描述需求、让 AI 生成代码、跑起来看效果——整个编程工作流正在被重新定义。但有一件事在 Vibe Coding 的叙事里被跳过了:开发者每天的工作不只是写代码,还有大量时间花在操作各种桌面应用上,从 Figma 里复制设计规范、到 Jira 里更新任务状态、到 Slack 里同步进度、再到各种内部系统里翻数据。这些操作不涉及代码,却占据了工作日的相当比例。
带娃的IT创业者
8 天前
人工智能
·
github
·
开源项目
·
ai agent
·
智能体
·
自我进化
GitHub 热门: coleam00/Archon —— 当 AI Agent 学会自我进化
在当下的 AI 开发领域,“Agent”(智能体)无疑是最高频的关键词。然而,许多开发者在实际构建 Agent 应用时,往往会陷入一个困境:我们花费大量精力编排 Prompt、设计工具调用链,最终得到的却是一个行为模式固化、难以应对复杂变化的"脚本执行器"。一旦业务逻辑发生微小的偏移,或者数据结构出现新的变体,我们往往需要重新修改代码。
DogDaoDao
9 天前
人工智能
·
深度学习
·
程序员
·
github
·
ai agent
·
智能体
·
agent skill
【GitHub】 Headroom 深度解析:AI Agent 上下文压缩层的完整技术拆解
一句话总结:Headroom 是一个在 LLM 收到内容之前自动压缩上下文的本地优先压缩层,通过 6 种自适应算法配合可逆缓存(CCR)机制,实现 60-95% 的 Token 削减,且回答质量零损失。
暗黑小白
9 天前
人工智能
·
架构
·
ai agent
第二篇:不碰模型,意图识别快 9 倍 —— P0→P1→P2 流水线设计
优化的最高境界不是换更强的模型,而是让该做的事情不需要模型来做。全量 LLM function calling:每次把所有 tool schema(5 个工具 × ~150 字描述)传给 Qwen,LLM 读完所有描述再抉择。我们用 qwen-turbo 实测了 500 次(50 条 query × 10 repeats):p50=477ms、p95=672ms、p99=1200ms。延迟分解:input token 编码(~730 tokens) + LLM 推理 + output token 解码(~
跟风舞烟学编程
9 天前
人工智能
·
ai agent
·
hermes agent
·
自进化 agent
Hermes Agent 从入门到企业实战-01:Hermes-Agent核心架构
🎯 本章目标:读完这一章,你就能跟别人讲清楚 Hermes Agent 是个什么东西,它凭什么 2 个月涨到 5 万星。
暗黑小白
9 天前
架构
·
ai agent
第六篇:本地模型选型 —— 4 个模型 × 2 种设备 × 2 项任务的全量对比
选模型不是找"最强"的那个,是找"刚好够用且最省资源"的那个。两个延迟敏感路径:工具选择要求 <100ms,信息提取要求 <500ms。云端 API 的 p99 延迟抖动(500ms+)不可接受。另外本地模型零 API 成本——每天 1 万次工具选择,不用模型 = 每年省 ¥2,800-¥8,500。
暗黑小白
9 天前
架构
·
ai agent
第五篇:Reranker 与 BM25 —— 在精排提升与降级可靠性之间划一条线
Reranker 的价值被普遍高估,BM25 的兜底能力被普遍低估——两者都需要你自己的数据来验证。学术界和社区普遍认为 Reranker 显著提升 Faithfulness(+17%),但在我们的 8 条测试用例上只加了 0.7%。
暗黑小白
9 天前
架构
·
ai agent
第十篇:纠纷协调与可观测性 —— 多Agent协作的全链路追踪
当三个 Agent(买家、卖家、平台)各有各的立场,你需要的不只是 LLM,还有全链路可观测。买家投诉"收到货坏了",卖家说"发货时是好的"。单一 Agent 会有偏见。
暗黑小白
9 天前
架构
·
ai agent
第三篇:RAG 的三个盲区 —— 混合检索 + 图增强的渐进式进化
RAG 不是一个技术选型问题,而是一个渐进式的问题发现过程——你只有上线后被用户怼了,才知道自己漏了什么。
暗黑小白
9 天前
python
·
安全
·
架构
·
ai agent
第八篇:人在回路与内容安全 —— 当 AI 说“让我请示一下“
Human-in-the-loop 看起来只是一个"审批按钮",背后是一整套状态机、超时策略和框架 hack。
暗黑小白
9 天前
架构
·
ai agent
第一篇:客服Agent 四层架构 —— 一个多Agent客服系统的设计全貌
好的架构不是设计出来的,是被问题逼出来的。本文以 5 个关键的架构决策为主线,串起整个系统的设计。电商客服 Agent 和通用RAG问答系统看起来很像——都是一个对话框。大多数团队的自然起步是搭一个标准 RAG 问答系统:文档切片 → 向量嵌入 → 语义检索 → LLM 生成。但在客服场景下,这个通用RAG问答系统方案有四个致命缺陷:
暗黑小白
9 天前
架构
·
ai agent
第四篇:HNSW 参数调优 —— efSearch 从默认 50 降到 32 的完整消融实验
默认参数是给"通用场景"的,你的场景需要自己的数据说话。Faiss HNSW 和 Milvus HNSW有本质差异,以下两点是 Milvus 特有、Faiss 不存在的:
暗黑小白
9 天前
架构
·
ai agent
第九篇:降级矩阵与 Token 限流 —— 生产系统的八道防线
生产系统不是在"一切正常"时体现价值的,是在"一切都在崩"的时候。如第一篇决策5所述的最坏情况推演(Qwen API 超时 + Milvus OOM + Redis 断连 + BGE Embedding 挂了 + NebulaGraph 不可用),系统能退化到"Qwen2.5-1.5B-Instruct 本地 GPU 推理,无 RAG 增强直接回答"。不是完美的回答,但不是 500。基于这个推演,我们为此设计了以下八维降级矩阵。
深色風信子
10 天前
agent
·
ai编程
·
ai agent
·
agentscope
SpringBoot 集成 AgentScope Java
星野云联AIoT技术洞察
10 天前
ai agent
·
技术方案
·
mcp
·
ag-ui
·
平台架构
·
命令确认
·
iot设备控制
AG-UI 在 IoT 控制台里怎么落地:设备状态、命令确认与人机协同
AG-UI 落到 IoT 控制台时,最重要的不是让 Agent 在页面上“会聊天”,而是让设备状态、建议动作、命令确认、执行结果和失败回滚都能被用户看见和打断。如果一个 IoT 控制台只把 AG-UI 当作聊天消息流,Agent 可能会解释得很好,但真正危险的设备动作仍然缺少状态边界、人工确认和审计证据。