Agent TARS 评测:开源版 Manus?实际体验告诉你答案!

前言

最近,字节跳动新开源了一款类 Manus 的 AI Agent 项目------Agent TARS。这是一款基于 UI-TARS(视觉-语言模型)的图形用户界面代理应用程序,允许用户通过自然语言与计算机进行交互和控制。

了解之后,我立刻下载并体验了一番,整体来说,这款工具确实具有一定的可玩性,但实际效果仍有较大的提升空间。对于国内用户而言,目前可能还不太适合使用,建议先观望一段时间,等待后续优化和改进。

Agent TARS

TARS 目前主要分为 UI-TARSAgent TARS 两个版本,它们在功能上有所区别。其中,UI-TARS 是早期版本,而 Agent TARS 则是 2025 年 3 月 18 日最新发布的升级版。因此,本文将重点介绍 Agent TARS

安装

目前,UI-TARS 提供了多平台的安装包,而 Agent TARS 仅支持 macOS ,其他操作系统的支持仍需等待。官方提供了 安装包brew 两种安装方式,推荐使用 brew 进行安装,操作简单快捷:

bash 复制代码
brew install --cask agent-tars

安装完成后,即可直接启动 Agent TARS 进行配置。

配置 TARS

成功安装后,首次运行需要进行一些必要的配置,以确保 TARS 能够正常执行任务。

系统设置

由于 Agent TARS 需要模拟用户操作,因此需要系统权限,按照以下步骤开启 辅助功能权限

  1. 打开 系统设置隐私与安全辅助功能
  2. 找到 Agent TARS,并开启访问权限。

配置大模型

Agent TARS 需要调用大语言模型(LLM)来解析用户指令并执行任务。目前官方默认支持以下模型:

  • Anthropic Claude
  • OpenAI GPT
  • Azure OpenAI

不过,我们也可以使用 兼容 OpenAI API 规范的大模型,例如:

  • DeepSeek
  • Qwen
  • Hunyuan
  • Doubao

配置步骤(以 DeepSeek 为例):

  1. 打开 Agent TARS ,点击左下角的 设置 图标。
  2. 进入 AI Models 选项卡,选择 OpenAI
  3. 开启 Use Custom Model Name 选项,并填写:
    • 模型名称
    • API Key
    • 接口地址

注意 : 不同厂商提供的 OpenAI 兼容接口,其模型名称可能有所不同,需要根据具体情况填写,比如 deepseek 官方的 r1 名称叫做: deepseek-reasoner ,在腾讯云部署的 deepseek r1 则直接叫 deepseek-r1

设置搜索引擎

Agent TARS 允许调用搜索引擎进行信息查询,支持:

  • Tavily Search(需要账户)
  • Bing(需要账户)
  • DuckDuckGo(无需账户)

不过,如果你使用的是 Clash 这类代理软件,Agent TARS 无法正常访问搜索引擎 。这是因为 Agent TARS 基于 Electron + Node.js ,其 Node.js 发起的请求不会自动使用系统代理。如果必须使用搜索功能,建议切换至支持全局代理的软件,如 Cisco VPN。

设置文件系统

在运行任务时,Agent TARS 可能需要访问本地文件系统。例如,它可以帮助用户创建、修改或读取文件。如果未提前设置,Agent TARS 在执行任务时会请求访问权限。

配置方法:

  1. 进入 Agent TARS 设置
  2. File System 选项中,手动添加可访问的文件夹路径。
  3. 点击加号(+)确认添加,否则即便点击 "Save" 也不会生效。

运行任务

安装并配置完成后,我们可以让 Agent TARS 执行一些任务,以下是一个生成个人介绍的示例

我让 Agent TARS 生成一个现代化的个人简介网页,并保存到本地:

帮我写一个网页,页面内容就是一个个人简介,使用中文撰写,页面要求好看、现代化,然后将文件输出到一个目录中

Agent TARS 成功执行了任务,生成了 HTML 页面,整体效果符合基本要求。

接下来,我尝试让它优化网页的结构,包括:优化样式 (现代化、简约、大气)、添加 SVG 图标增强交互体验将 CSS 和 JS 资源分离

请你将刚才的那个网页放到一个新的文件夹中,然后优化样式,要求页面符合现代化设计,简约大气、美观,然后加入一些图标进行装饰,可以使用 svg 绘制,加入一些交互反馈,同时对 css、js 等资源进行分离到文件中

虽然 Agent TARS 按要求创建了相关文件,但在实际应用中,发现其 HTML 文件未正确引用分离出的 CSS 和 JS

评测结果

1. 网络环境影响大

Agent TARS 具备浏览器自动化能力,但在国内环境下,由于网络限制,这部分功能无法正常使用。如果使用 Clash 这类代理,它无法继承系统代理规则,导致部分请求失败。而 Cisco VPN 等全局代理可能会有所改善。

2. 模型兼容性不足

官方推荐使用 Claude 模型,虽然支持了 OpenAI 接口,但还不能很好的执行任务,尤其经测试发现,并非所有模型都能顺利执行任务。部分 OpenAI 兼容模型在执行任务时会出现的错误。

3. Token 消耗巨大

Agent TARS 在执行任务时的 Token 消耗非常多 ,尤其是涉及复杂操作时。例如,我曾执行一个遍历文件夹并统计高频文件的任务,结果 消耗了上百万 Tokens,直接导致 API 提供商提示余额欠费。

就连上面示例上的简单 HTML 生成任务,也耗费了近 20 万 Tokens,成本较高。

4. 任务执行效果一般

从测试结果来看,Agent TARS 的执行效果 仍未达到理想水平,例如:

  • 代码生成质量一般(例如 CSS 和 JS 分离但未正确引用)
  • 部分模型执行失败
  • 复杂任务完成度不高

不过,这可能与所选模型的能力有关,后续优化或更换更强大的模型后,效果可能会有所提升。

结语

Agent TARS 作为一款新开源的 AI 助手,具备一定的可玩性,但仍有许多不足之处。 目前来看,它是开源版 Manus 中实现最完整的 AI Agent,界面、工作流都较为完善,但要达到理想的智能化效果,仍需继续打磨和优化。

如果你是技术爱好者,可以尝试体验并探索其潜力;但如果你期望它能真正提高工作效率,可能还需要再等等。

相关链接

相关推荐
xiangzhihong85 分钟前
AndroidGen,智谱推出增强大语言模型框架
人工智能
张拭心15 分钟前
Gemini 2.5:谷歌迄今最强"脑力天花板"模型,70 秒生成一个小游戏
前端·openai
cms小程序插件【官方】18 分钟前
phpcms版AI自动发文插件,自动创作,自动配图,自动发布,支持多种大模型
人工智能·phpcms自动发布
追逐时光者25 分钟前
一个基于 .NET 开源免费的异地组网和内网穿透工具
后端·.net
她的双马尾28 分钟前
前端性能优化
前端·nginx·webpack·性能优化
兔子的洋葱圈37 分钟前
【django】2-1 (django配置) 应用配置、中间件配置、模板配置
后端·python·django
luojiaao38 分钟前
【Python Web全栈开发】通过nginx实现http代理
前端·nginx·http
weixin_4435669838 分钟前
http 和 https
前端
绝无仅有44 分钟前
活动二维码qrcode的设置、生成与使用实践指南
后端·面试·github
紫雾凌寒1 小时前
自然语言处理|CLIP 的双编码器架构是如何优化图文关联的?
人工智能·深度学习·自然语言处理·大模型·openai·clip·多模态对齐