【ai agent?ai工具】prompt/context/harness ;mcp;skills;个人使用skills

agent

参考

【万字揭秘】2025年最大风口:Agent 智能体到底是什么?_哔哩哔哩_bilibili

说明ai agent是什么

大语言模型本质上擅长理解文字,回答我们的问题、问一些问题、聊聊天。但是面对更复杂、需要多步骤执行、跟外界交互的任务时,它就有点无能为力了。很多时候任务能不能完成,还得我们自己动手。所以很多人早期都把AI当成了一种高级的搜索引擎在用

Agent的核心就是要让AI能够真正实现自主完成任务,就是当AI收到一个任务时,它不仅要自己去想应该怎么做,还得要自己真的去做,所谓AI Agent就是代表人类去完成具体任务的AI

讲解了agent的感知能力

单纯的大语言模型是依靠海量的文本数据训练出来的,基础的感知方式就是接收用户输入的文本。但如果我想把图片或者 PDF 传给他看,或者能不能跟他语音交流呢?利用 OCR 这种中间工具,把图片或 PDF 转成文本再输入给大模型。但人们会发现,只提取其中的文字势必会丢失非常多的信息,比如图片的颜色布局、声音的语气语调等

2023 年 GPT-4 有了视觉版本,开启了多模态模型的初级阶段

规划能力

思维树,就是让大模型想好几种不同的思路,选最好的那个,但这样效果也一般,因为早期的大模型本质上就不擅长规划

人们还有另一个思路:分好几个模型,各个AI各司其职,协作完成任务,这个就叫Multi-agent(多智能体工作流)。不过了解Coze、DeepSeek 这类平台的朋友应该都有感受,这都治标不治本,中间的步骤都是人定好的,一旦换了新任务,还得重新设计

OpenManus24年研究并发布了O1O系列模型,也就是让大模型内化学会在每一次回答问题之前,都有一个自主的推理过程

行动能力

当模型觉得需要调用工具时,它会生成一段 API 调用的文本

生成这段文本后,会有一个过滤机制识别导,于是找到对应的功能函数并调用。等计算器完成计算后,结果会发回给大模型,再由大模型返回答案。这就是最早的 Function Calling 大模型

每个工具都要单独接入、单独开发实在太麻烦了,Anthropic在24年11月推出mcp

记忆能力

RAG(Retrieval-Augmented Generation,检索增强生成)

后面还说了agent的发展阶段,编程agent、搜索agent、医疗agent,最后主要讲Manus

理解

Agent的核心就是要让AI能够真正实现自主完成任务

ai ide

我的理解是, 把编程的agent和IDE环境进行了融合

一个孤立的 Agent 只能看到你给它的那段代码。而 AI IDE 会主动扫描整个项目,为 Agent 构建项目索引

AI IDE 通过工具调用(Tool Calling)协议,让 Agent 可以直接使用 IDE 内置的工具

AI IDE 提供了全新的交互方式(比如通过聊天窗口提任务,结果审查)

命令行 AI Agent

它们就是运行在终端(Terminal)里的编程 Agent

比如OpenCode 和 Claude Code

我个人的感受,比如在我有一个项目,而需要参考另一个项目的时候,这个命令行agent的跨文件处理任务就很不错

而且直接在终端使用,直接操作文件系统,更高效,占用内存少,毕竟qoder,trae这种都是用vscode的壳子,electron占用内存太大了

prompt engineering提示词工程,context engineering上下文工程,harness engineering控制工程

  • Prompt Engineering (PE)

    • Agent 开发者:他们在写代码构建"提示词模板生成器",研究怎么通过算法自动优化提示词,让模型在大规模并发下保持低成本和高准确率。
    • :你只需要在对话框里把话说明白。
  • Context Engineering (CE)

    • Agent 开发者:他们在写复杂的向量数据库检索逻辑(RAG)、设计记忆压缩算法(怎么把 100 页的会议记录压缩成 1 段话塞给 AI)、管理长短期记忆的滑动窗口。这是纯代码工作。
    • :你只需要点击"@文件"或者把文档拖进去。
  • Harness Engineering (HE)

    • Agent 开发者 :这是最硬核的。他们在搭建沙箱环境、编写自动化测试脚本、设计"AI 写代码 -> 运行测试 -> 报错 -> AI 自动修 -> 再测试"的死循环系统。这需要极强的后端架构能力。
    • :你只需要看 AI 生成的代码能不能跑通,不能跑通就复制报错信息给它。

工程技术:在智能体优先的世界中利用 Codex | OpenAI

根据文章描述,他们的工作主要集中在以下几层,这些都需要极强的工程能力:

  • 搭建"马具"(The Harness) :文章提到他们构建了一个环境,让 Codex 可以直接调用 gh (GitHub CLI)、运行本地脚本、甚至控制 Chrome 浏览器来验证 UI。这些"连接器"(Connectors)和"工具"(Tools)本身是需要代码的。 普通 AI IDE(如 Trae)已经内置了这些,但他们是自己造的轮子。
  • 编写"元规则" :他们写了一套极其严格的 Linter(代码检查器)和架构规范。例如,他们强制规定了代码层之间的依赖方向(Types -> Config -> Repo...)。这些规则代码是让 AI 能写出合格代码的前提。
  • 构建"沙盒":他们让 AI 拥有完全的可观察性(Logging, Metrics),甚至接入了 DevTools。这意味着他们必须先搭建好这套监控系统,让 AI 能"读懂"错误,而不是人类去读。

结论 :他们是在用代码去构建一个能运行 AI 的操作系统,而不是在写应用软件。

他们的工作流 vs. 你的工作流

你担心的是:"难道他们也是看能不能跑通,不能跑通就复制报错信息?" 绝对不是。

维度 你(普通后端 + AI IDE) 他们(OpenAI 文章中的团队)
错误处理 人工介入 。AI 报错 -> 你看日志 -> 你复制错误 -> 你问 AI -> AI 修。你是循环的一部分。 全自动闭环 。AI 报错 -> 系统自动 把日志喂给 AI -> AI 生成修复代码 -> 系统自动 运行测试 -> 直到通过。人类不在循环中。
反馈来源 你的大脑(经验)+ 报错信息。 自动化工具(Chrome DevTools, Prometheus, Linter)。这些工具直接告诉 AI 哪里错了。
开发模式 交互式。你和 AI 一问一答。 代理式(Agent)。人类下达一个宏观指令(如"实现登录功能"),然后去睡觉。AI 自己折腾 6 个小时直到搞定。
核心资产 写好的业务代码。 Prompt 模板 + 架构规则 + 自动化验证脚本

harness engineering

我决定不再review AI生成的代码了_哔哩哔哩_bilibili

这个视频算是吐槽了用ai生成代码,然后自己review很麻烦吧?up还说之后要用测试来测试代码 ,类似tdd一样

评论:

这思路已经过时了,可以看下最近提的harness agent flow,https://www.anthropic.com/engineering/harness-design-long-running-apps 可以看下a公司的这篇。目前可落地的部署工作流的有 langchain 下面的 langGraph、openHands这类的项目。

它是什么

Harness Engineering是什么?为什么最近热度这么高?_哔哩哔哩_bilibili

视频:prompt engineering解决的是怎么说,context engineering解决的是给它看什么,harness engineering解决的是让他在什么规则里头干活

这个视频简单讲解了指令工程、上下文工程、控制工程这三个
评论:

新瓶装旧酒罢了,大模型本质上就是通过控制输入,得到确定性的输出。一两句说不明白就多说两句,返回的结果不好就调整输入闭环来几遍

评论:

...... 先是为了彰显Agent的牛逼,和Workflow彻底割席。 然后发现步子太大扯着了,纯靠Agent有幻觉、不稳定,又回来捡Workflow。 但是又不能这么说,怎么办,那就造个新词。 ...... Harness Engineering,说白了就是,实践证明大模型不能彻底放手,需要在有设计的系统架构下,在优势区间发挥功能。

rules

全局的规则

MCP

视频教学

火遍全网的MCP是什么?怎么用?如何自己开发一个MCP服务?一个视频带你入门!_哔哩哔哩_bilibili

讲解了mcp

视频:

早期大模型交互依赖手动复制粘贴

后来出现的 Function Calling,不过虽然能让模型通过数据接口调用工具,但各厂商标准不统一,导致开发者需要为不同模型定制接口

MCP 通过制定统一标准接口,使得开发者只需开发一个服务,就能被所有支持 MCP 的大模型调用

演示了mcp的在线体验和本地使用(开源工具Cherry studio)

MCP是啥?技术原理是什么?一个视频搞懂MCP的一切。Windows系统配置MCP,Cursor Cline使用MCP_哔哩哔哩_bilibili

视频:

MCP本身没有什么神秘的,它的本质就是客户端用命令行调用了电脑上的Node.js程序,然后程序执行了某些操作,再把结果返回回来。当然也不仅限于Node.js程序,有可能是Python的

Skills

视频教学

手把手彻底学会 Agent Skills!【小白教程】_哔哩哔哩_bilibili

视频使用claude code演示,说明了下面四个

  • SKILL.md:指令只在需要时加载,节省Token并提升准确性
  • references文件夹:AI会根据Skill.md中的指引,只加载任务所需的特定参考文件,避免不必要的Token浪费和信息干扰
  • scripts文件夹:用于存放可执行脚本
  • assets文件夹:用于存放资源

问:skills不就是写提示词吗?

弹幕:skill工程化和流程化提示词,集成度更高
这个视频讲解了SKILL.md文档,还有其他文件夹,浅显但够用,作为了解不错


【2026版Agent Skills保姆级教程】2小时从会用到会造,全方位提升工作效率。Claude Skills、Agent技能、OpenCode_哔哩哔哩_bilibili

这个视频演示了安装opencode,然后说明skill的来历,演示了安装和使用skill

按照官方文档,说明了skill的规则(SKILL.md,还有其他三个文件夹)

演示开发skill

用官方提供的创建skill的skill,来演示创建skill

说明了skill的使用场景

最后1p,还列出了claude code、opencode、cursor等,项目级目录和全局目录的位置

这个视频还给出了安装步骤,仓库地址,更像一个教学视频,在看完上面的视频之后学习这个,更完善

文档说明

Agent Skills开放标准(这是Anthropic推动的跨平台标准):

Overview - Agent Skills

这个文档对agent的skills有一个大概的说明,虽然我主要看的是视频

【2026版Agent Skills保姆级教程】2小时从会用到会造,全方位提升工作效率。Claude Skills、Agent技能、OpenCode_哔哩哔哩_bilibili

这1p的视频有说,skills本来是Anthropic公司推出来,用来增强自家的claude code的功能,但是后来大家发现这太好用,于是行业纷纷跟进,25年12月18日官方正式将Agent Skills发布成一个跨平台、跨产品可复用的标准

ai ide或者命令行ai工具等都可以去各自的官网查看(各平台存放Skills的文件夹名称不同:如.claude vs .qoder vs .cursor)

qoder:

Skills - Qoder

这是qoder的skills的文档,我看这里目录结构和看的视频不同,但我觉得(以及问了ai)只要在 SKILL.md 中通过 Markdown 链接显式引用就行

我看了qoder和trae的关于skills的文档说明,目录都有些差异

我还看了cursor的文档说明,里面到是SKILL.md、references文件夹、scripts文件夹、assets文件夹(还贴出了Anthropic的Agent Skills的地址)

下载skill

04-下载skills_哔哩哔哩_bilibili

官方仓库:

anthropics/skills: Public repository for Agent Skills

Skills社群网站:

Agent Skills 市场 - Claude、Codex 和 ChatGPT Skills | SkillsMP

腾讯的,说是专为中国用户优化的Skills社区

这个skill下还有相关的实践,比如别人的文章或者视频等,感觉还可以

不管内容是真的少

Skill Hub 中国 - 实战 Skill 案例与可复用方案库

skill.sh市场

The Agent Skills Directory

使用skill

05-使用skill做企业网站设计_哔哩哔哩_bilibili

前端设计,后面几p还有使用excel的skill,生成视频的skill

**Custom commands(**合并到skills里)

官方已经将commands去掉了,合并到skills里了

个人使用skills

使用opencode

opencode文档

代理技能 | OpenCode

全局skill

skill-creator(创建skill的skii)

frontend-design(前端设计)

飞书

feishu-doc - Agent Skill by openclaw | SkillsMP

trae+skill

Trae+Skills打造最强黑科技---Github秒变私有Skill库 | Skill Hub 中国

qoder的skill使用

Skills - Qoder

文档里说了,qoder内置了技能,可以自动创建

还有通过skills cli安装的方法

命令分析

复制代码
# 从 skills.sh 市场安装
# -a 是 --agent 的缩写,它明确指定了这个技能是为 Qoder 这个智能体
npx skills add vercel-labs/agent-browser -a qoder

# 从 GitHub 仓库安装指定技能
# 适用于特定仓库中的特定技能。这个仓库里包含了很多个技能,必须用 --skill 参数告诉 CLI:"我要安装的是这个大仓库里的这一个小技能",而不是把整个大仓库都装进去
npx skills add https://github.com/anthropics/skills --skill skill-creator -a qoder

qoder中vercel-labs/agent-browser 是简写:它默认指向 GitHub

相关推荐
程序大视界2 小时前
2026国产AI视频生成工具推荐
人工智能·音视频
七夜zippoe2 小时前
Python生态未来展望:从AI到科学计算——社区趋势与技术方向深度解析
开发语言·人工智能·python·技术方向·社区趋势
加密棱镜2 小时前
OpenClaw 3.28 版本降级教程 规避 axios 恶意依赖风险
人工智能·深度学习·安全·openclaw
罗罗攀2 小时前
PyTorch学习笔记|单层神经网络
人工智能·pytorch·笔记·神经网络·学习
skywalk81632 小时前
Kotti Next:使用FastAPI+Vue 3构建的现代无头CMS-Kotti CMS的精神继承者(使用WorkBuddy AI自动编程)
前端·vue.js·人工智能·fastapi·kotti
aircrushin2 小时前
三月AI十件大事盘点
人工智能
CDA数据分析师干货分享2 小时前
统计学本科生CDA数据分析师二级备考经验分享
大数据·人工智能·经验分享·数据分析·cda证书·cda数据分析师
Cosolar3 小时前
RAG(检索增强生成)面试指南
人工智能·aigc·openai