CodeX的use-computer技能初探

什么是use-computer模式

最近啊,各家AI产品都开始整活了------Cloud Code、Code X、MiniMax、Maxi等可视化端产品,集体上线了一个叫use-computer 的功能。简单来说,就是让AI能够代替你操作电脑

它的工作流程是这样的:

  1. 行为预知

    :AI先在自己的知识库里"想象"这个事情应该怎么做

  2. 开始执行

    :按照预设的步骤开始操作

  3. 等待反馈

    :因为UI界面不是实时反馈的,所以会设置等待时间

  4. 截图验证

    :执行完一步后,截图判断当前状态,决定下一步

听起来贼美好是不是?但实际体验下来嘛......

Cloud Code的另类玩法

说到Cloud Code,这玩意儿在国内是被封禁访问的。但如果你想体验它的桌面端程序,有个骚操作------打开开发者模式。模式就是使用第三方API驱动 Claude Desktop App。

具体的操作见网址:https://claude.com/docs/cowork/3p/installation

理论上可以启用use-computer设置,但Cloud Code的桌面端我已经放弃了,现在主要使用它的终端程序,有兴趣的可以尝试一下留言反馈。

实际体验:一个字------慢!

我趁机使用了一下code X以及MiniMax的相关功能。

我第一次使用的时候,就简单打开一个编辑器,花了将近一分钟

为什么这么慢?

  • 大模型思考需要时间

  • 每一步操作后要截图判断

  • 等待UI反馈的固定延迟

  • 场景不稳定时还要反复尝试

唯一的好处是啥呢?就是在场景稳定、UI功能固定的前提下,这功能还是有实际使用场景的。

但token消耗嘛......那是相当可观。毕竟全程靠图像来判断行为逻辑。

我的思考

体验完这个技术之后,说实话我暂时没想到什么非用它不可的场景。

不过话说回来,任何技术都有自己的用武之地,就看大家怎么发挥想象力了。

如果想商业化大批量操作 ,那稳定性问题就大了去了。这也就是为什么现在CLI程序在AI领域更受欢迎的原因------简单、稳定、可控。

啊对,说到慢和不确定性,这不就是在形容我写代码的速度吗


新人不易,欢迎大家强势关注 - 阿丰在长春━(`∀´)ノ亻!

如果是长春本地技术,可通过k9629@qq.com联系我,互通有无,一起成长。

相关推荐
唐老板17 小时前
MCP协议实战:从零写个Agent工具
ai编程·mcp
counterxing18 小时前
最近发现一个 Mac 工具,有点像把 Raycast、语音输入法、截图和录屏塞到了一起
macos·ai编程·claude
薛定喵的谔18 小时前
Term Proxy — 用 Tauri 2 打造跨平台终端配置管理工具
electron·ai编程·全栈
小溪彼岸18 小时前
CC Switch可视化管理Skill、提示词、会话
aigc·ai编程
垚森20 小时前
我用 GLM-5.2 造了个炸裂主题后台:16 套主题随心切,可在线体验
ai·react
aqi001 天前
15天学会AI应用开发(九)利用Chroma持久化向量数据
人工智能·python·大模型·ai编程·ai应用
kfaino1 天前
你好,我叫 Prompt——其实,你一直在给 AI 写程序
后端·openai·ai编程
doiito1 天前
【Agent Harness】Gliding Horse 工具结果压缩体系:如何用“指针”驯服上下文膨胀
ai·rust·架构设计·系统设计·ai agent
kfaino1 天前
你好,我叫Token——AI世界里最忙的搬砖工
aigc·openai·ai编程