通过AWS Bedrock探索 Claude 的虚拟桌面魔力:让 AI 代替你动手完成任务!

前言

大家好,昨夜Anthropic 发布了更新。现在 Claude 3.5 Sonnet(V2) 和 Claude 3.5 Haiku,以及名为 computer use 的新功能已经作为公开测试版发布了。

Introducing computer use, a new Claude 3.5 Sonnet, and Claude 3.5 Haiku \ AnthropicA refreshed, more powerful Claude 3.5 Sonnet, Claude 3.5 Haiku, and a new experimental AI capability: computer use.https://www.anthropic.com/news/3-5-models-and-computer-use关于新模型,我打算稍后进行验证。这次更新给我带来最大震撼的是 computer use操作电脑完成复杂任务的能力。AWS的bedrock上已同步更新。让我们看看 computer use都能做些什么吧!

什么是 Computer Use?

简单来说,Computer Use 是一种通过 Claude 操作虚拟桌面环境来完成特定任务的功能。你只需通过提示词(prompt)告知任务内容,Claude 就会模拟人类的操作来解决问题。比如,它可以操控浏览器、编辑电子表格等,像是一个"虚拟助理"代替你操作电脑。这种体验让人仿佛拥有了一个自动化的助手来完成日常工作。

模型启用步骤

在开始使用前,需要在 Amazon Bedrock 上启用模型。以下是操作步骤:

  1. 切换区域到俄勒冈州后进入 Amazon Bedrock 控制台,
  2. 导航到 模型访问 (Model Access)。
  3. 在列表中找到 Claude 3.5 Sonnet v2
  4. 点击提交按钮,完成模型的激活。

目前,Claude 3.5 Sonnet v2 仅在俄勒冈区域可用。

尝试使用 computer use

在以下的代码库中提供了 QuickStarts ,我们将使用 Bedrock 进行尝试。

anthropic-quickstarts/computer-use-demo at main · anthropics/anthropic-quickstarts · GitHubA collection of projects designed to help developers quickly get started with building deployable applications using the Anthropic API - anthropic-quickstarts/computer-use-demo at main · anthropics/anthropic-quickstartshttps://github.com/anthropics/anthropic-quickstarts/tree/main/computer-use-demo

首先进行一些准备工作。

复制代码
# 克隆代码库
git clone https://github.com/anthropics/anthropic-quickstarts

# 切换目录
cd anthropic-quickstarts/
cd computer-use-demo/

# 配置 AWS CLI
# 使用通过 aws configure 配置的个人资料
export AWS_PROFILE=<指定要使用的个人资料>

如果你不知道 AWS_PROFILE如何创建。可以参考下面步骤。

1导航到IAM >用户>你使用的用户下创建访问密钥

2选择AWS之外运行的应用程序,下一步

3标签为可选性,可根据自己意愿决定是否填写。(建议填写方便管理)

4.记录好自己的密钥。后面的设置需要用到。

5.命令行执行如下命令创建PROFILE

复制代码
aws configure --profile <your_profile_name>

6.输入刚刚生成的内容完成profile创建

完成上面的步骤后,我们就可以启动Docker了

复制代码
docker run \
    -e API_PROVIDER=bedrock \
    -e AWS_PROFILE=$AWS_PROFILE \
    -e AWS_REGION=us-west-2 \
    -v $HOME/.aws/credentials:/home/computeruse/.aws/credentials \
    -v $HOME/.anthropic:/home/computeruse/.anthropic \
    -p 5900:5900 \
    -p 8501:8501 \
    -p 6080:6080 \
    -p 8080:8080 \
    -it ghcr.io/anthropics/anthropic-quickstarts:computer-use-demo-latest

一旦成功运行后,访问 http://localhost:8080,你会看到一个带有虚拟浏览器和聊天界面的 UI。这种界面通常用于模拟交互环境,让用户可以通过 Claude 等模型直接与虚拟桌面进行交互,例如自动化操作浏览器或处理文件。

通过在这个 聊天 UI 中输入一个简单的提示,比如 "google查询东京 天气,记录下周最高,最低气温,天气。查询结果记录在excel里。"

Claude 能够在执行任务时识别当前桌面状态,并基于这些信息决定如何完成任务。它似乎能够以像素级别感知桌面环境,从而更精确地理解当前界面和内容的状态。此外,它通过类似 Tool use 的方式,发出点击、鼠标移动等指令,以模拟用户的操作。这种能力使得 Claude 可以像人类一样操作虚拟桌面,完成复杂的任务。

他会自动打开浏览器去google里查询东京的天晴状况。

最后,Claude 自动打开了 LibreOffice ,并将收集到的信息整理成了 Excel 表格 。令人惊叹的是,即使我没有特别指示,它也完成了保存操作。这展示了 Claude 在执行任务时的智能化处理能力和高效工作流。

结语

由于这是一个沙盒环境 ,所以操作非常简单,可以轻松尝试各种功能!即使在当前阶段,Claude 已经能够胜任许多简单任务 ,给人留下了深刻印象。而且,考虑到它目前仍处于公开测试阶段,未来的发展更加令人期待!

想尝鲜又不想搭建环境?试试开发者社区的多模一站通吧!直接体验各种模型的超能力~
亚马逊云科技开发者社区

相关推荐
zhangshuang-peta几秒前
MCP 如何重新定义 Skill:从“能力函数”变成“可治理行为”
人工智能·ai·ai agent·mcp·peta
yubo05093 分钟前
计算机视觉第六课:打开摄像头,实时框出物体
人工智能·opencv·计算机视觉
FL16238631297 分钟前
窗户干净脏污分类窗户清洁状态分类数据集3299张2类别已划分训练验证测试集
人工智能·分类·数据挖掘
阿里云大数据AI技术15 分钟前
基于阿里云 DataWorks Data Agent 进行大模型热度分析
人工智能·agent·nvidia
碳基硅坊22 分钟前
Qwen3.5-9B在安全生产安全帽检测中的应用
人工智能·安全·安全帽检测·qwen3.5-9b
云烟成雨TD30 分钟前
Spring AI Alibaba 1.x 系列【66】Graph 长期记忆
java·人工智能·spring
春日见30 分钟前
五分钟入门 强化学习---Q-Learning算法与实现
人工智能·python·深度学习·算法·机器学习·计算机视觉
卡次卡次140 分钟前
vibecoding起步之Claude Code的skills是什么,里面有什么文件,以ppt的一个skills举例
人工智能·opencv·powerpoint
AI服务老曹40 分钟前
解耦异构算力:基于 Docker 与 GB28181/RTSP 的边缘计算 AI 视频管理平台架构设计与源码交付实践
人工智能·docker·边缘计算
小饕1 小时前
RAG 实战:文本切块(Text Chunking)从入门到精通
人工智能