一、Agent Skills 智能体技能
Agent Skills(智能体技能)是 Anthropic 在 2025 年 10 月推出的 一套开放标准,目的是让 AI 能够学习使用各种专业技能,快速扩展特定领域的专业能力。
简单来说,Agent Skills 就是给 AI 准备的 技能包。技能包里有精心设计的提示词、代码脚本、还有各种资源文件。
把 AI 想象成一个职场小白,给他装上 文档处理技能,它就立刻知道怎么生成 PPT、处理 Excel 表格;装上 代码规范技能,它就知道怎么按照公司标准写代码。
Skill 的本质是一个包含 SKILL.md 文件的文件夹,里面可以放置指令说明、脚本代码、参考资料等。当 AI 遇到相关任务时,会自动加载对应的 Skill 来增强自己的能力。

Skills 的核心设计是 渐进式披露,AI 只在需要时才加载相关内容,不会一次性把所有信息都塞进上下文,既节省 Token 又保持灵活性。

二、Hooks 钩子
Hooks(钩子)是 AI 编程工具中的一种自动化触发器。当 AI 完成某个动作(比如生成代码、提交代码、运行命令)时,Hook 会自动执行你预设的脚本或检查流程。
各种主流 AI 编程工具都支持 Hooks,比如在 Claude Code 中,Hooks 可以用来:
1、代码生成后自动运行格式化工具
2、文件修改后自动执行测试
3、限请求时自动判断是否安全并批准
4、提交代码前自动检查代码规范

Hooks 让你的 AI 工作流更加自动化,减少手动操作。但是要注意,Hooks 配置不当可能会阻塞 AI 的正常工作流程,建议先在小范围测试,确认没问题再推广到整个项目。
三、斜杠命令
斜杠命令(Slash Commands)是在 AI 编程工具的对话框中输入 / 触发的快捷指令,可以快速执行常用操作。
你可以把斜杠命令理解成操作 AI 的快捷键。Cursor、Claude Code 等主流 AI 编程工具都支持斜杠命令,比如 Claude Code 内置了这些常用的斜杠命令:
/help:查看可用命令
/compact:压缩当前对话的上下文
/config:修改配置
/skills:查看已安装的技能

你可以自定义斜杠命令,把常用的工作流封装起来复用。比如创建一个 /commit-push-pr 命令,一次性完成代码提交、推送和创建 PR;或者搞个 /techdebt 命令,每次会话结束跑一下清理重复代码。
自定义命令的本质其实就是一个 Markdown 文件,在 Cursor 中,只需要在项目的 .cursor/commands/ 目录下创建 .md 文件,里面写上你想要 AI 执行的指令,这个文件名就会变成一个斜杠命令。还可以用 Git 版本控制工具来管理自定义命令的文件,跨项目复用。

四、A2A(Agent-to-Agent)
A2A(Agent-to-Agent)是指 AI 智能体之间相互通信和协作的协议或方式,是多智能体系统的基础技术。
就像人和人之间需要语言来沟通,AI 智能体之间也需要标准化的方式来交换信息、分配任务、汇报结果。
A2A 协议让不同的 AI 智能体能够组成团队,分工合作完成复杂任务。这个协议由 Google 在 2025 年推出,目前已有超过 150 家企业加入支持。

不要把 A2A 和 MCP 搞混!二者是互补关系,MCP 解决的是 AI 连接工具的问题,A2A 解决的是 AI 之间沟通协作的问题。
五、MCP 模型上下文协议
MCP(Model Context Protocol)是 Anthropic 在 2024 年底推出的开放标准,用于让 AI 模型安全地连接外部数据源和工具。
你可以把 MCP 理解成 AI 世界的 "USB 接口"。就像 USB 接口让各种设备(键盘、鼠标、U 盘)都能用同一种方式连接电脑一样,MCP 让各种外部工具(文件管理、数据库、搜索引擎等)都能用同一种方式连接 AI,不用为每个工具单独写一套对接代码。

MCP 的核心价值在于 标准化。开发者不需要为每个 AI 工具单独开发连接器,只需要按照 MCP 标准开发一次,就能被所有支持 MCP 的 AI 工具使用。目前 Claude Code、Cursor、Windsurf 等主流 AI 编程工具,以及各种网页 AI Agent 应用都已经支持 MCP 协议。
六、Browser Use 浏览器使用
Browser Use(浏览器使用)是让 AI 智能体能够自主操控网页浏览器的技术能力。通过 Browser Use,AI 可以像人类一样浏览网页、点击按钮、填写表单、提取数据。
Browser Use 的典型应用场景:
1、自动化研究:让 AI 在多个网站上搜索、整理信息
2、数据采集:从网页中提取结构化数据
3、表单填写:自动完成繁琐的在线表单
4、跨平台操作:在不同网站间完成多步骤任务
比较知名的开源项目是 Browser-Use,支持通过 Python 调用多种大模型来控制浏览器。此外,Cursor、Claude Code 等主流 AI 编程工具也内置了 Browser Use 能力,可以在开发过程中自动打开浏览器预览效果、执行测试等操作。
Browser Use 的一个关键优势是,AI 可以利用你现有的浏览器会话和登录状态,无需为每个网站单独开发 API 集成。也就是说,AI 能够访问那些没有公开 API 的网站,大大扩展了自动化的应用范围。
七、Computer Use 计算机使用
Computer Use(计算机使用)是 Anthropic 公司在 2024 年推出的 AI 能力,让 Claude 大模型能够像人类一样操作整个计算机桌面。
和 Browser Use 只能操作浏览器不同,Computer Use 可以操作任何桌面应用程序,比如:
1、查看屏幕截图,理解界面元素
2、移动鼠标光标,点击按钮
3、使用键盘输入文字
4、执行命令行操作
Computer Use 的工作原理是一个持续的反馈循环:
1、截图分析:AI 捕获并分析当前屏幕
2、决策规划:根据任务目标确定下一步操作
3、执行操作:发送鼠标/键盘输入
4、观察结果:检查操作效果,调整策略
为了安全起见,Computer Use 一般需要在虚拟机或容器中运行,不会直接控制你的真实电脑。
Computer Use 代表了 AI 从 "只能生成文字" 到 "能够操作软件" 的重大跨越,彻底改变人机交互方式。
基于 Computer Use 技术,Anthropic 在 2026 年推出了 Claude Cowork,这是一个桌面端 AI 助手,可以直接访问你电脑上的文件和文件夹,帮你整理下载目录、从截图中提取数据到表格、准备品牌报告等日常办公任务。
