大家好,我是Ai学习的老章
国内 AI Agent 这条赛道我一直在追,天工的产品之前就用过,最近发现它们的官网大变样,更新了一系列新功能
我本来以为又是常规的"挤牙膏"式升级,点进去用了两天才反应过来------这次不是加几个功能那么简单,是直接把产品形态换了:从"帮我生成一份 PPT/文档/图片",进化成"我下一个目标,它端到端把整个项目跑完"

天工这次,把自己变成了一只"云端龙虾"
玩过 AI Agent 的朋友应该都知道 OpenClaw 那套东西------本地部署、配 API、调环境、单配主机,一套折腾下来,普通人根本玩不转,最后还卡在自己电脑算力不够上。天工这次直接把整套龙虾能力搬上了云端:注册即用,没有任何部署门槛,关掉电脑它照样在跑
在这个基础上,它叠了三件事:
- 7×24 小时云端执行:任务在云上跑,不占你本地电脑,你睡觉它工作,你开会它也工作
- 多模态并行创作:文档、PPT、图片、表格、网页、视频,六件事可以同时开工,不用排队
- 专业 Skill 协同:每个模态背后都是一个专家级智能体,可以单独调用,也可以像搭乐高一样串成一整套工作流

本文就实际感受一下,测试中穿插介绍功能亮点:
测试 1 数据分析报告
我从公众号后台导出了两个 Excel,其中一个是最近 30 天用户增长情况,一个是文章的阅读数据

正式执行前,可以先看天工使用的模型
国内旗舰大模型集齐了:Kimi K2.6、DeepSeek V4 Pro、GLM 5.1、MiniMax M2.7、Qwen 3.6 Plus,不需要自己配置API,直接上手就可以用
建议直接选择智选模型,工作流中有些小任务完全可以由稍小一些的模型来完成,比如 DeepSeek V4 Flash,Qwen 3.6 Flash

天工经过了技能读取、Jupyter 和 bash 执行、最终发布物生成等步骤

公众号近30天数据分析报告_讲解视频
上面的视频大家应该可以看到,选中任意输出的内容,都可以让它再次优化,比如文字的润色、扩写、缩写、调整语气

测试 2:PPT 生成
从同一个输入框轻松制作文档、PPT、图片、表格、网页、视频确实省事儿
比如把第一个测试中的数据分析报告做成 PPT
它没问我"请上传文件",直接接住上一轮的结果跑去做了
这件事看起来很小,但用上一周才会反应过来------整个对话框就是你和这支云端团队的共享工位
你不用再切五个工具、重新喂五次上下文,前一个交付物自动成为下一个任务的输入

它先获取了 HTML 中的素材,然后规划大纲,最后使用内置的 PPT 生成 Skills 制作 PPT

生成的 PPT 也能在最小元素或整页重新生成

PPT 可以直接下载到本地,也可以另存为 PDF 格式

测试 3:视频生成
这一步的视频生成我没有动用旗舰大模型
天工内置了一众能力遥遥领先的模型------Seedance 2.0、Kling 3.0...,尤其是Seedance2.0,绝对是视频生成领域的顶流

我觉得生成一个玩梗、搞笑、无厘头的视频那就太大材小用了
实际上我也尝试了

我这里要继续上面的任务,把PPT转成带讲解的视频

这里面涉及------口播稿生成、讲解音频生成、FFmpeg视频合成
主要帮手是内置的视频Skills

耗时十几分钟,天工一边做一边解决问题

最终成品,大家感受一下
测试 4:图像生成

这里顺便介绍稍微有点隐秘的功能,只有你输入提示词之后才能看到------保存为预设提示词,这个比较适合图像生成或视频生成,有提示词模板时使用,但是我在后面的使用中发现了更舒服的玩法

天工的图像生成能力也有点超出我预期啊,之前我都只用 Image 2 制作海报和封面的

细节拉满

然后我就发现了天工的又一隐藏功能------Skills 自动发现并创建
常用的提示词,它会确定其是否可复用,提示创建技能

点击创建技能之后,它会自动调用 /skill-creator 开始创建

后面再有类似任务,直接@出来这个刚刚创建的 Skills 就行了

测试 5:飞书链接,每日定时任务
对接飞书大家应该非常熟悉了,天工里对接起来很方便
输入App ID和App Secret 就行了

对接之后就可以手机上用飞书给天工下指令,比如我每天都要关注AI行业动态
就可以让它定时执行任务,每天8点给我发送整理好的资讯

总结:
这次我真正感受到的变化,是天工已经从单点 AI 工具,走到了云端项目执行系统的感觉。
我给它的目标其实很完整:先读取公众号后台导出的 Excel,做数据分析报告;再把报告整理成 PPT;接着继续生成口播稿、讲解音频,并用视频 Skills 合成讲解视频;最后又测试了图像生成、提示词预设和 Skills 自动创建。整个过程里都是云端执行,它会自己读取文件、调用 Jupyter / bash、拆解步骤、生成发布物,中间还能对文档、PPT、图片、视频做二次编辑。
这也是我觉得最诱人的地方:不用先学部署、配 API、接一堆工具,再在文档、PPT、表格、视频、图片之间来回搬运。一个输入框背后,已经有旗舰模型、云端执行环境、全模态编辑器和专业 Skills 协同。对个人博主、内容团队、运营同学来说,它最像是把"数据分析师 + PPT 设计师 + 视频制作 + 视觉设计 + 自动化助理"揉进了一个云端工作台。
感兴趣的可以去评论区链接试一下,建议直接拿一个你真实头疼的多步骤任务丢进去,感受会比单独问它一句话更明显