harness

无心水14 小时前
网络·人工智能·openclaw·harness·hermes·honcho
【Harness:核心原理】7、反馈层(Feedback):给 AI 装上“后视镜”,越用越聪明的核心秘密关键词:反馈层、Feedback Layer、AI 自我进化、自动反馈、人工反馈、闭环学习、Hermes 学习循环、DBNT 协议、Agent-in-the-Loop 字数:约 9500 字 | 阅读时长:20 分钟 适用人群:AI 架构师、MLOps 工程师、Prompt 工程师、AI 产品经理
deephub2 天前
人工智能·python·大语言模型·多智能体·harness
从零搭建 Harness Engineering 框架 :Rule、Skill、Sub-Agent等工程落完整路径Harness Engineering(脚手架工程)这个概念已经流行一阵了。网上大多数文章都停留在理论层面,反复解释为什么现代 AI 开发不能再依赖单个 Prompt、也不能把模型当成"聪明的代码自动补全"。不过这里有一个实际问题被反复提及:
stereohomology2 天前
大语言模型·hallucination·engineering·harness
一直怕大模型幻觉,发现针对性harness约束能大大消除最近我在尝试让大语言模型(LLM)自动生成万字以上的长篇行业分析报告和技术调研文档。初看生成结果,文笔流畅、结构严谨,但当我进入人工审核环节时,却惊出一身冷汗:文中充斥着大量胡编乱造的数据、虚构的参考文献以及看似合理实则毫无根据的结论。
Loli_Wolf2 天前
人工智能·深度学习·算法·microsoft·ai·ai编程·harness
AI 原生研发闭环:从提需到线上监测,再自动回到提需过去两年,企业采用 AI 编码工具的主问题已经从“能不能补全代码”转向“能不能进入真实研发系统,并对结果负责”。单点 AI 助手提升的是局部效率:写代码、写测试、总结 PR、解释报错。AI 原生研发闭环要解决的是系统效率:从客户反馈、线上指标、产品洞察、PRD、技术方案、代码变更、测试评审、CI/CD、发布治理、线上观测、事故复盘,再把证据沉淀回下一轮需求。
创世宇图4 天前
人工智能·ai·harness
【AI入门知识点】Harness 是什么?为什么 DeepSeek 要组建 Harness 团队?最近,DeepSeek 招聘信息中出现了一个越来越高频的关键词——Harness 团队。 很多人第一反应是: Harness 是什么?一种新模型?还是某个框架?为什么 DeepSeek 专门成立团队来做这个?
BurningFish4 天前
ai·harness
别让 LLM 写文件:一套 Agent 进度跟踪的工程化范式摘要:用"把Schema塞Prompt、让LLM写文件"做Agent进度跟踪,我翻车了。本文把我栽过的坑、钩子postToolUse救不了的根本矛盾、Claude Code是怎么绕过去的,以及一套可落地的工程范式,一次讲清楚。
SLD_Allen5 天前
人工智能·prompt·上下文·harness
从Prompt、Context到Harness,工程的三次进化OpenAI 内部的一支 3 到 7 人小团队,在短短五个月内,让 AI 生成了将近 100 万行生产级别的代码。据称全程,没有一个工程师亲手写过一行业务逻辑代码。
无心水6 天前
人工智能·性能优化·openclaw·养龙虾·harness·hermes·honcho
【Harness:全局认知】3、Harness 如何改写软件交付规则?从 52.8% 到 66.5% 的跨越背后关键词:Harness 历史意义、AI Agent 架构、软件交付、Anthropic、Mitchell Hashimoto、LangChain Terminal Bench、AI 原生交付、可控智能体 字数:约 9200 字 | 阅读时长:22 分钟 适用人群:AI 架构师、DevOps 工程师、技术决策者、AI 平台产品经理
白鹿第一帅7 天前
火山引擎·白鹿第一帅·coding plan·harness·agent plan·afp·agent燃料值
从“模型”到“能力”:火山引擎 Agent Plan 如何重构智能体开发范式文章作者:白鹿第一帅,作者主页:https://blog.csdn.net/qq_22695001,未经授权,严禁转载,侵权必究!
花千树-0108 天前
java·langchain·llm·agent·langgraph·subagent·harness
SubAgent 基础:拥有自主工具的子代理标签:Java SubAgent 子代理 自主工具 McpAgentExecutor j-langchain 前置阅读:Skill Agent:把子工作流封装成可复用的 Tool 适合人群:已掌握 Skill 用法,希望构建拥有自有工具的独立子代理的 Java 开发者
Joseph Cooper8 天前
agent·codex·claudecode·harness
Claude Code 与 Codex Harness 设计对比:一种加法,一种减法图 1:两个 CLI agent 的 harness 哲学对照——左边 TS/Bun 把不变量编进类型,右边 Rust/Tokio 把不变量压到内核 syscall。
deephub9 天前
人工智能·大语言模型·agent·harness
Agent = Model + Harness:模型决定上限Harness 决定下限Claude Code 和 Cursor 并不是用来跟 AI 对话的界面。同一个项目上跑AI 编码助手:Claude Code、Trae 和 Qwen,你就会发现同一个任务,换一个工具,结果就不一样。
小脑斧12310 天前
ai·harness·模型工程
2026 AI Agent 爆发:决定智能体上限的不是模型,是 Harness 工程AI-SKILL全行业技能一键调用平台(ai-skills.ai),简直无敌!!!2026 年被业界公认为 AI Agent 规模化落地元年。DeepSeek V4、GPT-6、Claude Opus 4.7 等大模型推理能力突飞猛进,但大量企业落地 Agent 时依然面临:调用混乱、状态丢失、重复错误、成本爆炸。越来越多团队意识到:模型决定下限,Harness(智能体调度框架 / 工程)才决定上限。本文从范式跃迁、核心架构、工程实践、成本优化、避坑清单五大维度,详解 2026 年 Agent Harne
Joseph Cooper10 天前
人工智能·ai·agent·eval·harness
生产级 AI Agent 评估体系:从 12 指标框架到持续评估闭环摘要:95% 的企业 AI pilot 失败,根因不是模型不行,而是没有评估体系。本文从 100+ 部署案例的 12 指标框架出发,手把手教你搭建生产级 Agent 评估闭环。
xiaoxue..11 天前
架构·ai编程·harness
Harness Engineering 讲解过去很长一段时间里,大家一提到“大模型怎么用好”,第一反应往往是:Prompt 怎么写?于是,Prompt Engineering 成了很多人学习大模型的第一站。我们学习如何提问,如何给角色,如何写任务,如何给示例,如何让模型一步一步思考。
guslegend11 天前
人工智能·harness
第4节:在 ReAct 循环中剥离独立的 Thinking 阶段Agent Harness 专题上一节:第3节:核心心脏,手写 Agent 的 Main Loop本节:第4节:在 ReAct 循环中剥离独立的 Thinking 阶段
Soari12 天前
架构·harness
Harness Engineering:深度拆解 Anthropic 官方“长周期智能体(Long-Running Agents)”高效驾驭架构发布日期: 2025-11-26标签: #Anthropic #ClaudeCode #AIAgent #长周期任务 #驾驭工程 #系统架构
JaydenAI13 天前
langchain·人机交互·hitl·deep agents·harness
[Deep Agents:LangChain的Agent Harness-06]通过HumanInTheLoopMiddleware引入人机交互某些较为敏感工具在执行之前需要引入人工审理,此时就需要使用到HumanInTheLoopMiddleware。HumanInTheLoopMiddleware旨在为Agent增加一道安全护栏,它通过LangGraph的中断实现了人机交互。在工具调用前引入人工干预,确保敏感操作(如发送邮件、删除数据、大额转账)必须经过人类审核方可执行。
GoodTimeGGB14 天前
agent·飞书机器人·harness·hermes·agent plan
Windows 原生部署 Hermes Agent + 火山引擎 Agent Plan + Harness + 飞书机器人 完整实战教程与踩坑总结大家好,我是 GoodTime。最近成功在 Windows 上部署了 Hermes Agent,完整接入火山引擎 Agent Plan + Harness 联网搜索,并打通飞书机器人,同时增加了图片、视频生成等能力。以下是详细部署流程和踩坑总结。
SharpCJ14 天前
aigc·agent·harness
当 AI 开始写代码,谁来保证它不会翻车?你让 AI Agent 写代码,它说"已完成,测试通过"——你信吗?我们越来越依赖 AI Agent 来写代码了。Copilot、Cursor、Claude——它们在几分钟内就能生成完整的功能模块,测试用例也顺手写好。效率确实惊人。