字节版“Codex”初体验,Seed 2.1pro所有人免费用!

听说这一波字节 Seed 2.1 Pro 又牛逼了!

我一直在找使用途径,发现只有它们家的 Trae Work 上可以第一时间免费使用,那么我们就把 Work 搞起来。

这些天 Codex 好像安静了很多。而国内类似的软件开始活跃起来了。我们之前已经介绍过智谱版"Codex"------ZCode!

今天体验一波字节版"Codex"以及最新的豆包 Seed 2.1 Pro 模型!

重点提示,Work 上面所有人所有模型免费使用!

昨天白天还无法使用 3.1 Pro,而且排队一千多人,晚上就解锁了,而且非常丝滑了,几个项目一起跑都可以。

下面就来看看怎么搞的。

立马去官网下载安装包,双击启动,一路 Next:

安装完成之后长这个样子:

Trae Work 很明显走的也是 Codex 类型线路,当然它还学习了 Claude 的结构。把主功能分成了办公(Work)和编程(Code)两种模型,同时也支持手机远程。

反正这类通用智能体该有的功能全部都有,字节的产品体验肯定没话说了。单从软件的丝滑程度来说,肯定是国内顶级的存在!

下面我就分三块来给大家呈现一下这个软件!

1. 手机远程

虽然我一年可能也用不上几次,但是就是很迷恋这类远程功能。我大致体验了一下,也是非常丝滑的。尤其是对话无缝同步这一块。Codex 还需要多端科学上网,而 Trae Work裸奔即可,用起来非常灵活,非常丝滑。

只要安装好手机版之后,几乎可以做到无感同步:

桌面版上有一个远程配置入口,点击一下就会弹出配置界面。

其实不用配置什么,主要是开启控制权。

这一步就两个选项,有一个是允许移动端控制这个设备,第二个是保持电脑唤醒状态。我一般是全部启用,我的 PC 是不关机的。现在一般笔记本也是直接合上!

点击完成,然后所有对话、进度就会实时同步了!

它这个同步是非常丝滑的啊!消息通知,任务列表,以及详细的对话信息。这一切都会丝滑同步。

相比 ZCode 而言,Trae Work 很明显做得更加大众化,体验更好。而 ZCode 明显更加专业,更加适合开发者。

我之前远程工具基本是 GPT 手机版和 Claude 手机版,用起来也挺好的。但是国内的手机和电脑搞起来就会有点麻烦。现在可以把 Mate 手机用起来,Window用起来,走 Trae 这条线路了。

2. 办公 Work

随着 AI 的普及,模型能力的增强。目前这类智能体已经不再仅限于程序员了。大家都在从 Coding Agent 转向 Work Agent,抢占打工人的市场。

所以字节正在猛推它的 Work 功能!这个上面的名字也是叫 Trae Work!

下面就来看一下这个Work功能到底怎么样?都能干点啥?

打开软件之后,默认就是在 Work 状态,这个界面非常简单,就一个输入框。

输入框右下角可以选择模型,默认是 auto 模式,你可以通过点击选择最新的 Seed 2.1 Pro。

底部给了 4 个常见的用例,今天我们就都来试一下!

因为我刚用的时候,2.1 版本还是锁着的,所以我当时直接选择了 auto 模式来制作,大家可以看一下效果。

第一个例子是"网页读取"

研读这篇论文 openreview.net/forum?id=WE...,生成一篇通俗易懂、结构清晰、图文并茂的论文综述。

它的执行时间和执行结果如下:

它最终生成的交付内容是一个网页,点击就可以查看:

这个页面做得还是不错的,图文并茂!

这里有一个非常关键的部分,它可以自动根据上下文生成合适的图片。因为字节在多模态、图片生成和视频生成上都是国内顶级的存在。所以它这个 Work 功能就非常 Work 了。类似 Codex 自带自家顶级的图片生成功能一样,会直接比对手领先一个级别。

第二个例子是"调研分析":

调研当前主流短视频平台的差异化优势和发展路径,并整理成一份汇报的演示稿件。调研范围包括平台基本情况、用户规模、内容生态、推荐机制、商业化模式以及代表性案例。重点对比不同平台在用户群体、内容类型和增长策略方面的差异,并总结其成功经验与未来趋势,为产品或市场策略提供参考。

点击一下用例,直接发送:

这个任务花了 13 分钟。做了一个 21 页的 PPT。

包含了大量可视化元素:

  • ECharts 柱状图(中国平台MAU对比)
  • ECharts 雷达图(用户画像五维对比)
  • ECharts 饼图(商业化收入结构)
  • 数据对比表格(平台画像、算法机制、海外对比)
  • AI 生成专业背景图(封面、章节分隔页)

这一块是字节最擅长的领域,加上这是官方演示 demo,效果自然是非常惊艳的!

报告用网页PPT 的方式展示,思路清晰,角度全面,数据丰富,图文并茂

所有领域都能有这个水准的话,就真的非常Work了!

第三个例子是"数据挖掘":

挖掘并分析全球 AI 行业近三年的市场增长数据。1、包括投资规模、企业数量、技术方向以及主要应用领域等。2、数据来源可以包括行业报告、公开统计数据和市场研究资料,需要标注数据来源。3、通过对数据进行整理和可视化,分析近几年 AI 市场的发展趋势、热点赛道以及潜在增长机会。

同样点击用例,直接发送:

这个例子用了 7 分钟左右:

根据公开数据,梳理了 2023 年到 2025 年的全球 AI 市场核心指标。

最终形成了一个网页版的报告。

之前那部分是有自动生成的图片,这一部分是包含了大量"可互动的表格"。

这种图文,图表自动混排的报告看起来还是很舒服的!

最后还有一个例子是:文件整理!

这个我就不演示了,因为我的文件太多了,乱中有整,你一旦给我整理了,我就搞不清楚了。

从演示的这个例子以及结果来看,Trae 这个 Work 很明显和很多常规的 Work 是不一样的,它其实偏向了比较专业的人士。

它并没有简单地聚焦于说做个 Word、做个 PPT,或者像豆包一样搞些吃喝拉撒的事情。它这个 Work 明显是知识和信息密集型的 Work!

因为整个报告非常长,而且有很多内容,所以我没有全部展示。但是大致预览一下,以我这个不怎么 work 的人角度来看,还是挺专业的。

而且我当时用的还是自动选择的模型,大概率是上一代的某个版本。今天早上,我发现Work中的 2.1 Pro 也已经解锁了,那肯定新版本会更好一些。

其实这类智能体软件界面都是非常简单的,关键还是它的模型,以及如何控制模型发挥得更好!

这个么,只能深入使用之后才能知道。

尤其是,除了官方例子之外的场景表现如何,还是一个大大的问号❓

今天只是体验,不是测评,所以我不展开。

3. Code

Work功能终于讲完了,接下来就是我们最熟悉的Code功能。

一般小公司可能会需要在 Work 和 Code 之间做二选一,但是作为字节这种大公司,当然是全部都要了

我们先来看一下Code的主界面:

界面同样非常简单,就一个输入框,一个模型选择,底部有一些用例。这些用例主要是包含了应用开发、项目理解、游戏创意、工具脚本,这几个例子其实我都跑了一下。

昨天白天的时候,Code部分这个 2.1 Pro 还没解锁,我是用 2.1 Turbo 跑了三个例子。

晚上发现 Pro 出来了,我又全部重新跑了一遍!

我先不说结果怎么样,我就说它这个 token 给得是真的非常充足

晚上11点,同时干好几个测试项目,居然没有遇到频率限制。

白天我还吐槽字节太小气,晚上就不一样,跑了一大堆项目,都不知道烧了多少Tokens了,爽的很。

我记得当时 ZCode 是送了 500 万 token 啊,可能一个项目就干没了。

如果是那个 Kimi 的话,即便是它的收费套餐,要跑完这些例子的话,估计得好几天,一个例子,它就会消耗它的几个 5 小时周期。我这那么多例子,基本能消耗它一周的配额。

好了废话说完,看看效果,我们先来看它的第一个例子"应用开发"

这个例子的需求是这样的:

开发一款支持多语种学习的在线教育平台,涵盖英语、日语、韩语等主流语言。

平台需打造沉浸式语言学习体验,提供以下能力:

1、分级课程体系

2、互动式学习模块(单词记忆、语法练习、口语跟读、听力训练)

3、学习进度追踪功能

4、支持用户注册登录

5、个性化学习路径推荐

6、社区交流及成就激励系统

这个例子总共消耗了 1 小时 8 分钟。

最终的产物如下:

没想到豆包都能一口气干这么久了,真的是士别三日刮目相看了。

这是一个基于 React 18 + TypeScript + Vite + TailwindCSS 的项目,目录结构如下:

bash 复制代码
src/
├── components/layout/     # 布局组件(Navbar, Footer, MainLayout)
├── pages/                 # 13 个页面组件
│   ├── Home.tsx           # 首页
│   ├── Login.tsx          # 登录
│   ├── Register.tsx       # 注册
│   ├── Courses.tsx        # 课程列表
│   ├── CourseDetail.tsx   # 课程详情
│   ├── Learn.tsx          # 学习中心
│   ├── Vocabulary.tsx     # 单词记忆
│   ├── Grammar.tsx        # 语法练习
│   ├── Speaking.tsx       # 口语跟读
│   ├── Listening.tsx      # 听力训练
│   ├── Dashboard.tsx      # 学习数据
│   ├── Community.tsx      # 社区交流
│   └── Profile.tsx        # 个人中心
├── store/                 # Zustand 状态管理
├── data/                  # Mock 数据
├── types/                 # TypeScript 类型
└── utils/                 # 工具函数

这个结构还是非常清晰的,这套技术方案也是目前 AI 最擅长的一个方案。面向 AI 编程的人肯定已经见过很多次了。

我们可以看到,它开发完整之后也是做了"质量保证"的:

  • ✅ TypeScript 类型检查通过
  • ✅ 生产构建成功
  • ✅ 开发服务器正常运行
  • ✅ 所有页面路由可访问
  • ✅ 响应式布局适配

然后生成了两个文档,一个是技术架构文档,一个是 PRD 需求文档。

技术文档里包含了架构设计、功能描述、路由定义、数据模型、核心功能、模块说明、性能优化等章节。

PRD 需求文档包含了产品概述、核心功能、核心流程、用户界面设计等章节。

毕竟是官方演示项目,那是做到非常全面了。

软件的右上方还显示了完整的待办列表。

软件右下方显示了上下文情况、技能、文件等信息!

我们来看一下它的结果吧,说再多都不如看结果。

首页:

学习功能页:

注册和登录功能:

底部效果:

具体的课程页面:

毕竟是写了一个多小时,这个例子还是非常完整的。

首先,没有任何基础的代码错误!

其次,没有布局上的混乱,设计也还可以。

然后,功能也比较全面,每个板块的内容,包括注册登录、头部底部,能看到的功能基本上都能用了。

单看这个例子来看的话,编程能力相当在线!当然,官方演示,大家都懂的,我先不展开说!

然后我体验了一下它的第二个例子"项目理解":

刚好刚刚开发了一个项目,然后就让它理解一下这个项目吧,生成一个 Code Wiki 吧!

大概花了三分钟,就把 Wiki 写完了:

内容非常多,我就截个图意思一下:

这个可以!

它是有一个很好的章节划分的,而且每一个章节都按一个比较好的规范编写。

这部分人类做起来会很枯燥。

十几年前,我开发了一个比较大的项目。我当时写了几百页的交付文档,写了好几个星期,人都快疯了,比写代码痛苦多了。写完之后,我都无力复查一遍了,然后很快就被打印成了厚厚一本~~我都不知道有多少错别字,还好现在与我无瓜了!

以后这种苦活累活,就交给 AI 了!Trae Code 这个文档质量还是可以的,应该有做专门的优化训练!如果这个功能文档,让它打打杂也是不错的。

除了上面两个例子,我还体验了一下第三个例子"创意游戏":

这个我就不多评价了,我就说一句 "菜就多练"!

软件相关的内容大概就是这些了!

这篇文章我刻意避开了模型部分,我只是从应用的角度入手,重点来给大家展示一下Trae Work这个软件。

这个软件我也是第一次使用,今天只是第一感受。初见,一般印象都会好一些,熟了就只剩吐槽了。

同类软件我已经用过很多了。

Trae Work 整体来说,非常好上手。无非就是一个输入框,选一下文件夹,选一下模型,输入需求一个回车即可。

Trae这个系列其实起步非常早,是所有国内同类软件中起步最早的。你们以前应该有在我的截图中看到过这个图标(绿色那个)。

我一直都是 Trae 国际版用户,最早是白嫖去的,开始收费后,为了 Claude 3.7,充了 100 美元上了"贼船",然后 Claude 3.7 立马就被下架了!哈哈哈~~所以 AI 产品不要随便充年卡。

它们最早做的是类似 VS Code 的 IDE,然后一路干到了 Solo,现在又干到了 Work。前面两个我都第一时间体验了,这个 Work 还是第一次使用。

大家可以永远相信字节的用户体验,毕竟它是当前产品能力最强的科技公司。

而且这个 Trae 是国内、国外两条腿走路,非常全面。

最神奇的一点是,你可以在国内不用科学工具的情况下,直接用上国际版中的 GPT 和 Gemini 模型。比较可惜的是 Claude 已经被掐了,否则就是我的主力工具之一!

因为我开了年会员,所以我一直使用里面的 GPT 来打杂,顺带看看文件内容之类的。

接下来我可能也抛弃IDE版,直接转向这个Work版了。

作为纯国内用户,Trae Work 好像也是一个不错的选择!

毕竟该有的都有,既有 Work 功能,又有 Code 功能,还有手机远程功能。

而且它还几乎包括了国内所有的模型,除了自家的 Seed 系列,还有最新的 GLM-5.2、Kimi-K2.7、MiniMax M3!

注意,平时这些模型还都是免费的(热门模型排队难免)。

我看他们应该也扛不了多久了,要逐步开始收费了。

就这样吧,我在上面已经跑了好多编程测试项目了。快的话下午应该能看到,慢的话明天!

让我来测测"豆姐"到底有多少斤两?ARENA 榜单是否靠谱?是否真的能和 Opus 4.7 掰手腕?

我对软件一般会宽容一些,对模型就会严格一些!

相关推荐
半个落月2 小时前
从 Tokenization 到 Embedding:用 Node.js 搞懂大模型为什么先“分词”再“向量化”
人工智能·node.js
vanuan2 小时前
MCP协议实战(Java版):用Spring Boot让AI直接查你的数据库
人工智能
雪隐3 小时前
个人电脑玩AI-06让5060 Ti给你打工——不光能画画,Qwen3-TTS还能学人说话,连我老板都信了!
人工智能·后端·python
码哥字节3 小时前
Claude Code 准确率从 41% 升到 89%,这个 CLAUDE.md 只做了一件事
agent·ai编程·claude
Coffeeee3 小时前
帮你快速理解AI Agent之我想招个Android实习生
android·人工智能·agent
沉默王二3 小时前
Agent底层原理连问8道,从ReAct到记忆压缩,PaiCLI项目实战拆解
面试·agent·ai编程
新新技术迷3 小时前
AI聊天自动跟随滚动,附回到底部按钮
人工智能
先锋部队3 小时前
用Web Worker解析AI返回的大文本不卡UI
人工智能
把你拉进白名单3 小时前
8.OpenClaw源码解析——三层洋葱重试
人工智能·llm·agent