大家好,我是袋鼠帝。
一直以来各家都在卷Agent,但最近有一个明显感受:Agent干活终于越来越稳了。
这个感受是从Codex开始的。不知道你们有没有感觉,最近Codex更新了几个版本之后,干活真的丝滑了很多,布置一个多步骤的开发任务给它,基本上不用我中途救场,干活太好用了。
比如全自动操控浏览器帮我申请YouTube api key、根据一套Skills完成产品宣传片,基本上都能一次性搞定,而且完成质量还挺高,逻辑链、质量稳定。
但从评论区,以及一些朋友的私聊中,发现有个问题是:Codex对国内小伙伴的使用门槛还是高了。
现实是劝退的------魔法上网、注册、跨境支付、短信验证、API配置......一整套从0搞下来,光是门槛就足以把90%的人拦在门外。我的评论区和私聊,几乎每周都有人在问这些问题。
所以当我最近发现一个国内的Agent,给了我同样、甚至更顺畅的感觉时,我是真的有点兴奋。
它叫天工超级智能体,最近刚做了一次大升级。开箱即用、生态完善、全模态一站搞定,有些地方甚至比海外Agent还要顺手。
对于任何人来说,稳定才是生产力的前提。
正好我在用Agent进一步完善我的创作工作流(自媒体分发流程),没想到天工做得还真不错。
同时,这个想法在我今天参加了谁能成为百万博主的活动后,更强烈了。
就是做公众号的博主,怎么把其他平台做起来,比如视频号,小某书等等。
有时候,不是不想做,是精力不够。所以,在AI时代,我希望用Agent来帮我。
所以就有了我今天要分享的skill:repurpose-article skill,或者说一套分发工作流。
先看看天工是个啥
先用一句话讲清楚:天工是一个云端AI团队平台。你在输入框下达目标,它会自动调度多个专家智能体帮你干活。
你可能会问:这和我自己搭一套龙虾(Open Claw那一类)有啥区别?
区别可太大了。
跟龙虾这些海外Agent,甚至是国内一些本机上龙虾产品不同的是,天工完全不用部署、不用装环境、不用配API Key、不用买主机,注册就能用。
它内置了6大专家级技能:文档、PPT、图片、表格、网页、视频。这些技能会自动搭配着用,按你说出自己的需求,天工自己判断该调用哪些技能、按什么顺序来。
模型这块我看了一下,还挺猛的。主调度模型有DeepSeekV4 Pro、GLM-5.1、Kimi-2.6、MiniMax-2.7、Qwen3.6-Plus,都是国内一线旗舰模型。
视频模型更离谱,直接内置了Seedance 2.0和可灵3.0。
Seedance 2.0大家应该知道的,世界第一的视频生成模型。现在天工直接给装上了,能在Agent里面自由使用。
同时,小龙虾有的,天工超级Agent也支持,比如定时任务+飞书直连。你可以设好时间和频率,让AI按你的节奏主动推进工作,做完之后直接把结果推到你的飞书。
设定好任务,该干嘛干嘛去,到点了打开飞书,活干完了,你只管收菜就行~
跑真实业务
光说不练假把式。
我其实一直都在做AI辅助创作提效,为的就是尽可能实的把自己的工作中除了人的部分全部交给AI来完成,我最近做了一个repurpose-article Skill。
它的功能很简单:把一篇公众号文章链接丢进去,自动转化成小红书图文、视频、可视化网站、PPT四件套。
在接入天工超级Agent使用之前,功能其实有些单薄。小红书图文还好,视频这块用的是Agent转hyperframes,效果也还行,但毕竟还是HTML转视频,没有那么流畅,有时候有点像动态的PPT。
但如果是借助天工超级智能体的专家技能和Skills市场就不一样了。
现在我一篇文章链接丢进去,四种内容格式并行出来(小红书、视频、网页、PPT)。
就拿我之前那篇AI的开源项目Prompt 4万Star开源神作曝光顶级AI们的System Prompt来看看。
我把文章链接丢给天工,让它按repurpose-article的流程执行。
然后,很有意思的事情来了。
天工先读取了文章内容,然后开始Skill的流程拆成了四套子任务,它把四个物的生成任务拆成了并行的子任务,同时在跑。
我盯着看了一会,左边的对话里面一步步执行:先用脚本生成article.json和初始骨架,然后同时启动小红书、视频、网站和PPT四个子任务。
这个多线程的感觉,是真爽。
小红书图文:直接出片
先看小红书:天工根据文章内容,自动规划了一套小红书卡片。
会先生成三张封面图,然后用户选中一种,再继续生成。
下图我就选中了Data Pop风格,然后它就能很高效的批量生成。
Style锁定为Data Pop。现在批量生成卡片,每张都以定制封面为模板。
最后它把这些卡片全部生成出来了,完全就是小红书风格,直接就能发。
而且这里有个做得不错的细节:天工生成的这些图片,在天工里面是可以拆分元素编辑的。
你觉得哪张卡片文字不对、颜色不好,直接在天工里改,不用出来改。这个体验真的太好啦。
视频:从分镜到成片一条龙做完
然后是视频。这块以前是很头疼的------文章转视频,怎么拆成画面镜头、旁白怎么匹配、节奏怎么掌握、画面怎么生成,以前每一步、每个环节都是孤立的。
还好天工现在把这一串全包了。
它先按Skill里的视频流程,把文章拆成分镜脚本,每个镜头标好了时长、画面提示词、镜头运动、旁白金文案、屏幕文字。这套结构化的分镜直接喂给Seedance 2.0生成画面。
效果如下(作为科普视频,还不错):
然后在旁白这块也没让我失望。天工直接调了语音模型把旁白生成出来,配合每个镜头的时长自动对齐,你不用自己去录、也不需要开第三方配音工具。
更让我惊讶的是,第一版10个生成音频都有滴滴声,但是人工剪辑我觉得太麻烦了。当我告诉天工的时候,它直接识别到了滴滴声,帮我把每段音频1.2s的滴滴声给剪掉了,这活干的太漂亮了~
然后我发现居然还能针对生成的视频,直接在天工上进行剪辑
跟剪映一样,时间线、字幕、转场、滤镜、音频素材都能配置和修改,不用再导出来切到剪映里二次加工。
最后所有镜头拼起来,加上字幕、转场:一条可以直接发的短视频就出来了。
对于起号阶段的号来说,这是最轻量化的试错方式。
我以前用别的工具做这种视频,可能要在3个工具之间来回切:AI chat工具、视频生成工具、剪辑工具。
目前天工一条线下来全干完了,这种"端到端"的体验,在国内Agent里也是很少见的。
可视化网站
让天工顺便帮我把这篇文章做成了一个漂亮的可视化的静态网站。
而且直接部署好了,给了我一个可以访问的URL。

PPT 演示稿
第四个是PPT。天工先生成了一个7页的PPT大纲,然后调用了pptx技能生成高质量的演示文稿。
这个PPT我觉得有个很牛的点:它不是简单地把文章内容粘过去,是会根据Skill的指令精准拆解文章,挑出最适合做PPT的部分。
比如它把Grok的6种角色模式拿出来做了独立页面,甚至复用了文章中的插图。
目前小红书卡片、视频、网站、PPT,全部都能在天工里直接编辑。
图片可以拆分元素修改,网站可以看源码改代码,PPT可以直接调整内容,这个全模态编辑器是我目前在国内Agent平台里还没见第二家有的👏
「最后」
这套四件套如果我一个个手动做------小红书排版、视频分镜、搭网站、做PPT,至少要花一整天。
现在天工就能全搞定,甚至是并行完成。
当然也不是完美的,比如小红书卡片的配色、文字偶尔需要手动调一下,PPT的排版有时候会有点瑕疵。但整体的出品已经很高了,十个产物里至少七八个能直接用。
而且就算有点问题,也可以通过天工的全模态编辑器快速修正。
现在大家离Agent越来越近了,但说实话,真正能把龙虾用好的人很少。我身边不少朋友,龙虾装上玩了几天,就吃灰了。
因为对于很多人来说,配环境、出了bug不知道怎么修、而且模型API切换也不方便。
我觉得下一个阶段好的Agent,一定是让普通人也能低门槛地把Agent用好,真正解决日常碰到的各种复杂问题和重复工作。
天工这次升级,至少让我看到了这一个可能:不用装环境、不用配API、不用买主机,打开浏览器就能拥有一支工作稳定的云端Agent团队。
感兴趣的朋友可以体验一下。
另外,本篇用到的Skill,目前还在打磨中,计划后续优化得更好之后开源。大家帮忙多多三连,我尽快优化,并开源🥳
我是袋鼠帝,一个致力于帮你把AI变成生产力的博主。
我们下期见~
能看到这里的都是凤毛麟角的存在!
如果觉得不错,随手点个赞、在看、转发三连吧✨
如果想第一时间收到推送,也可以给我个星标⭐
谢谢你耐心看完我的文章~