Agent TARS 评测:开源版 Manus?实际体验告诉你答案!

前言

最近,字节跳动新开源了一款类 Manus 的 AI Agent 项目------Agent TARS。这是一款基于 UI-TARS(视觉-语言模型)的图形用户界面代理应用程序,允许用户通过自然语言与计算机进行交互和控制。

了解之后,我立刻下载并体验了一番,整体来说,这款工具确实具有一定的可玩性,但实际效果仍有较大的提升空间。对于国内用户而言,目前可能还不太适合使用,建议先观望一段时间,等待后续优化和改进。

Agent TARS

TARS 目前主要分为 UI-TARSAgent TARS 两个版本,它们在功能上有所区别。其中,UI-TARS 是早期版本,而 Agent TARS 则是 2025 年 3 月 18 日最新发布的升级版。因此,本文将重点介绍 Agent TARS

安装

目前,UI-TARS 提供了多平台的安装包,而 Agent TARS 仅支持 macOS ,其他操作系统的支持仍需等待。官方提供了 安装包brew 两种安装方式,推荐使用 brew 进行安装,操作简单快捷:

bash 复制代码
brew install --cask agent-tars

安装完成后,即可直接启动 Agent TARS 进行配置。

配置 TARS

成功安装后,首次运行需要进行一些必要的配置,以确保 TARS 能够正常执行任务。

系统设置

由于 Agent TARS 需要模拟用户操作,因此需要系统权限,按照以下步骤开启 辅助功能权限

  1. 打开 系统设置隐私与安全辅助功能
  2. 找到 Agent TARS,并开启访问权限。

配置大模型

Agent TARS 需要调用大语言模型(LLM)来解析用户指令并执行任务。目前官方默认支持以下模型:

  • Anthropic Claude
  • OpenAI GPT
  • Azure OpenAI

不过,我们也可以使用 兼容 OpenAI API 规范的大模型,例如:

  • DeepSeek
  • Qwen
  • Hunyuan
  • Doubao

配置步骤(以 DeepSeek 为例):

  1. 打开 Agent TARS ,点击左下角的 设置 图标。
  2. 进入 AI Models 选项卡,选择 OpenAI
  3. 开启 Use Custom Model Name 选项,并填写:
    • 模型名称
    • API Key
    • 接口地址

注意 : 不同厂商提供的 OpenAI 兼容接口,其模型名称可能有所不同,需要根据具体情况填写,比如 deepseek 官方的 r1 名称叫做: deepseek-reasoner ,在腾讯云部署的 deepseek r1 则直接叫 deepseek-r1

设置搜索引擎

Agent TARS 允许调用搜索引擎进行信息查询,支持:

  • Tavily Search(需要账户)
  • Bing(需要账户)
  • DuckDuckGo(无需账户)

不过,如果你使用的是 Clash 这类代理软件,Agent TARS 无法正常访问搜索引擎 。这是因为 Agent TARS 基于 Electron + Node.js ,其 Node.js 发起的请求不会自动使用系统代理。如果必须使用搜索功能,建议切换至支持全局代理的软件,如 Cisco VPN。

设置文件系统

在运行任务时,Agent TARS 可能需要访问本地文件系统。例如,它可以帮助用户创建、修改或读取文件。如果未提前设置,Agent TARS 在执行任务时会请求访问权限。

配置方法:

  1. 进入 Agent TARS 设置
  2. File System 选项中,手动添加可访问的文件夹路径。
  3. 点击加号(+)确认添加,否则即便点击 "Save" 也不会生效。

运行任务

安装并配置完成后,我们可以让 Agent TARS 执行一些任务,以下是一个生成个人介绍的示例

我让 Agent TARS 生成一个现代化的个人简介网页,并保存到本地:

帮我写一个网页,页面内容就是一个个人简介,使用中文撰写,页面要求好看、现代化,然后将文件输出到一个目录中

Agent TARS 成功执行了任务,生成了 HTML 页面,整体效果符合基本要求。

接下来,我尝试让它优化网页的结构,包括:优化样式 (现代化、简约、大气)、添加 SVG 图标增强交互体验将 CSS 和 JS 资源分离

请你将刚才的那个网页放到一个新的文件夹中,然后优化样式,要求页面符合现代化设计,简约大气、美观,然后加入一些图标进行装饰,可以使用 svg 绘制,加入一些交互反馈,同时对 css、js 等资源进行分离到文件中

虽然 Agent TARS 按要求创建了相关文件,但在实际应用中,发现其 HTML 文件未正确引用分离出的 CSS 和 JS

评测结果

1. 网络环境影响大

Agent TARS 具备浏览器自动化能力,但在国内环境下,由于网络限制,这部分功能无法正常使用。如果使用 Clash 这类代理,它无法继承系统代理规则,导致部分请求失败。而 Cisco VPN 等全局代理可能会有所改善。

2. 模型兼容性不足

官方推荐使用 Claude 模型,虽然支持了 OpenAI 接口,但还不能很好的执行任务,尤其经测试发现,并非所有模型都能顺利执行任务。部分 OpenAI 兼容模型在执行任务时会出现的错误。

3. Token 消耗巨大

Agent TARS 在执行任务时的 Token 消耗非常多 ,尤其是涉及复杂操作时。例如,我曾执行一个遍历文件夹并统计高频文件的任务,结果 消耗了上百万 Tokens,直接导致 API 提供商提示余额欠费。

就连上面示例上的简单 HTML 生成任务,也耗费了近 20 万 Tokens,成本较高。

4. 任务执行效果一般

从测试结果来看,Agent TARS 的执行效果 仍未达到理想水平,例如:

  • 代码生成质量一般(例如 CSS 和 JS 分离但未正确引用)
  • 部分模型执行失败
  • 复杂任务完成度不高

不过,这可能与所选模型的能力有关,后续优化或更换更强大的模型后,效果可能会有所提升。

结语

Agent TARS 作为一款新开源的 AI 助手,具备一定的可玩性,但仍有许多不足之处。 目前来看,它是开源版 Manus 中实现最完整的 AI Agent,界面、工作流都较为完善,但要达到理想的智能化效果,仍需继续打磨和优化。

如果你是技术爱好者,可以尝试体验并探索其潜力;但如果你期望它能真正提高工作效率,可能还需要再等等。

相关链接

相关推荐
SHIPKING39343 分钟前
【机器学习&深度学习】什么是下游任务模型?
人工智能·深度学习·机器学习
zwjapple4 小时前
docker-compose一键部署全栈项目。springboot后端,react前端
前端·spring boot·docker
子燕若水5 小时前
Unreal Engine 5中的AI知识
人工智能
极限实验室6 小时前
Coco AI 实战(一):Coco Server Linux 平台部署
人工智能
tan180°6 小时前
MySQL表的操作(3)
linux·数据库·c++·vscode·后端·mysql
杨过过儿6 小时前
【学习笔记】4.1 什么是 LLM
人工智能
像风一样自由20206 小时前
HTML与JavaScript:构建动态交互式Web页面的基石
前端·javascript·html
巴伦是只猫6 小时前
【机器学习笔记Ⅰ】13 正则化代价函数
人工智能·笔记·机器学习
大千AI助手6 小时前
DTW模版匹配:弹性对齐的时间序列相似度度量算法
人工智能·算法·机器学习·数据挖掘·模版匹配·dtw模版匹配
AI生存日记6 小时前
百度文心大模型 4.5 系列全面开源 英特尔同步支持端侧部署
人工智能·百度·开源·open ai大模型