OpenClaw 完全指南:让你的 AI 助手真正『长』在浏览器里

OpenClaw 完全指南:让你的 AI 助手真正『长』在浏览器里

这不是另一个 ChatBot,这是你的数字分身。

什么是 OpenClaw?

OpenClaw 是一个浏览器原生的 AI 助手框架 ,它不只是聊天------它能 、能操作 、能记住

核心能力:

  • 🔍 视觉感知 - 通过浏览器快照理解当前页面
  • 🖱️ 操作执行 - 点击、输入、导航、截图
  • 🧠 长期记忆 - MEMORY.md 持续记录重要信息
  • 📅 定时任务 - Cron 调度器自动执行
  • 🔌 技能扩展 - 支持自定义 Skills

快速开始

1. 安装

bash 复制代码
npm install -g openclaw

2. 配置

bash 复制代码
openclaw configure

3. 启动

bash 复制代码
openclaw gateway start

4. 连接浏览器

  1. 打开 Chrome
  2. 加载 OpenClaw 扩展(开发者模式 → 加载已解压的扩展)
  3. 点击扩展图标,确保显示 ON

核心功能详解

📸 浏览器快照 (Snapshot)

OpenClaw 能"看见"当前页面:

csharp 复制代码
用户:帮我看看这个页面有什么
AI: [执行 browser snapshot]
→ 返回页面元素树(带 ref 引用)

示例输出:

csharp 复制代码
- button "发布笔记" [ref=e28]
- textbox "输入标题" [ref=e722]
- img "封面图" [ref=e802]

🖱️ 元素操作 (Act)

基于 ref 引用执行操作:

javascript 复制代码
// 点击元素
browser act click ref=e28

// 输入文本
browser act type ref=e722 text="我的标题"

// 等待
browser act wait timeMs=2000

📂 文件操作

bash 复制代码
# 读取文件
read path=./MEMORY.md

# 写入文件
write path=./note.md content="内容"

# 编辑文件
edit path=./config.json oldText="旧" newText="新"

⏰ 定时任务 (Cron)

bash 复制代码
# 每天早上 9 点提醒
openclaw cron add \
  --schedule "0 9 * * *" \
  --text "早上好!今天有什么创作计划?"

🧠 记忆系统

MEMORY.md - 长期记忆存储:

markdown 复制代码
## 用户偏好

- 称呼:大帅比
- timezone: Asia/Shanghai
- 通知渠道:飞书

## 项目记录

- 小红书账号:泛海书屋
- 内容定位:书籍 + 人生感悟

memory/YYYY-MM-DD.md - 每日日志:

markdown 复制代码
## 2026-03-09

- 发布了小红书笔记《30 岁后才读懂的书》
- 创建了自动选题 cron 任务

实战场景

场景 1:自动发布小红书

ini 复制代码
用户:帮我把这篇发到小红书
标题:「28 岁,这本书治好了我的讨好型人格」
内容:[正文...]

AI 执行:
1. browser navigate creator.xiaohongshu.com
2. browser snapshot → 找到"写长文"按钮
3. browser click ref=e28
4. browser type ref=e722 text="标题"
5. browser type ref=e727 text="内容"
6. browser click ref=e729 (一键排版)
7. browser click ref=e802 (选择封面)
8. browser click ref=e1264 (下一步)
9. browser click ref=e1654 (发布)

场景 2:自动选题 + 通知

javascript 复制代码
// Cron 任务:每天 9 点
{
  "schedule": "0 9 * * *",
  "payload": {
    "kind": "agentTurn",
    "message": "生成 3 个书籍类选题"
  }
}

// 完成后飞书通知
message send \
  --target "ou_826cf9cb4172e26ff1f1969fc5b0b89c" \
  --message "📚 今日选题已生成..."

场景 3:跨会话协作

bash 复制代码
# 主会话 spawn 子代理
sessions_spawn \
  --task "研究 ShortVideo.AutoPublisher" \
  --timeoutSeconds 300

# 子代理完成后 ping 主会话
sessions_send \
  --sessionKey "main" \
  --message "研究完成!发现 5 个相关工具..."

Skills 生态

内置 Skills

Skill 功能
weather 天气查询
github GitHub CLI 封装
apple-notes Apple Notes 管理
apple-reminders 提醒事项管理
healthcheck 安全审计

自定义 Skills

创建 Skill 目录结构:

perl 复制代码
my-skill/
├── SKILL.md      # 技能说明
├── script.sh     # 执行脚本
└── assets/       # 资源文件

最佳实践

1. 记忆管理

markdown 复制代码
✅ 好的记忆:
- 用户偏好(称呼、时区、通知渠道)
- 项目上下文(账号、定位、目标)
- 重要决策(为什么选择 X 方案)

❌ 避免:
- 敏感信息(密码、API Key)
- 过期的临时数据

2. 浏览器操作

javascript 复制代码
// ✅ 推荐:等待元素加载
browser act wait timeMs=2000
browser snapshot

// ❌ 避免:立即操作(可能元素未加载)
browser click ref=e28  // 可能失败

3. Cron 任务设计

yaml 复制代码
# ✅ 好的任务:
- 每天 9 点:生成选题
- 每天 10/15 点:提醒休息
- 每周一:周报总结

# ❌ 避免:
- 高频任务(token 消耗快)
- 无意义任务(纯问候)

4. 错误处理

markdown 复制代码
当操作失败时:
1. 重新 snapshot 获取最新页面
2. 检查元素 ref 是否变化
3. 等待更长时间再试
4. 告知用户具体错误信息

高级技巧

1. 多标签页管理

bash 复制代码
# 列出所有标签
browser tabs

# 切换到指定标签
browser focus targetId=xxx

# 在新标签打开
browser open url=https://...

2. 截图与下载

bash 复制代码
# 截图
browser screenshot fullPage=true

# 下载文件
browser download ref=e123

3. 子代理协作

bash 复制代码
# spawn 子代理(隔离会话)
sessions_spawn \
  --task "深度研究 X 主题" \
  --model "qwen3.5-plus" \
  --thinking "on" \
  --timeoutSeconds 600

# 发送消息到子代理
sessions_send \
  --sessionKey "xxx" \
  --message "补充一下 Y 部分"

常见问题

Q: 浏览器连接不上?

bash 复制代码
# 检查扩展是否加载
openclaw browser status

# 重启网关
openclaw gateway restart

# 确认扩展已"附加"到标签页(图标显示 ON)

Q: 操作失败率高?

markdown 复制代码
1. 增加等待时间(wait timeMs=3000)
2. 每次操作前重新 snapshot
3. 使用 aria refs(更稳定)

Q: 如何备份记忆?

bash 复制代码
cd ~/.openclaw/workspace
git add MEMORY.md memory/
git commit -m "日常记忆备份"
git push

总结

OpenClaw 不是另一个 ChatBot------它是:

  • 🎯 操作型 AI - 不只是聊天,能真正做事
  • 🧠 有记忆的 AI - 记住你的偏好和上下文
  • 可扩展的 AI - Skills 生态持续成长
  • 🔄 自动化的 AI - Cron 定时任务解放双手

开始构建你的数字分身吧!


相关资源:

相关推荐
刀法如飞2 小时前
AI时代,程序员都应该是算法思想工程师
人工智能·设计模式·程序员
理想小青年2 小时前
OpenClaw网络搜索Tavily Search Skill 安装教程
人工智能
yangpow23 小时前
深度解析 OpenClaw:一个自托管 AI Agent 网关的架构设计与安全机制
人工智能
agentium3 小时前
1小时LangChain教程
人工智能
工边页字3 小时前
面试官:请详细介绍下AI中的token,越详细越好!
前端·人工智能·后端
Miku163 小时前
OpenClaw-Linux+飞书官方Plugin安装指南
linux·人工智能·agent
Miku163 小时前
OpenClaw 接入 QQ Bot 完整实践指南
linux·人工智能·agent
熊崽4 小时前
Claude Code CLI+英伟达免费api 教程
人工智能
AI攻城狮4 小时前
OpenFang 给我的一个提醒:AI Agent 真正难的不是自主,而是治理
人工智能·云原生·aigc