内置Seedance2.0等国产顶级模型,这款小白轻松用好的Agent太顶了!

大家好,我是袋鼠帝。

一直以来各家都在卷Agent,但最近有一个明显感受:Agent干活终于越来越稳了。

这个感受是从Codex开始的。不知道你们有没有感觉,最近Codex更新了几个版本之后,干活真的丝滑了很多,布置一个多步骤的开发任务给它,基本上不用我中途救场,干活太好用了。

比如全自动操控浏览器帮我申请YouTube api key、根据一套Skills完成产品宣传片,基本上都能一次性搞定,而且完成质量还挺高,逻辑链、质量稳定。

但从评论区,以及一些朋友的私聊中,发现有个问题是:Codex对国内小伙伴的使用门槛还是高了。

现实是劝退的------魔法上网、注册、跨境支付、短信验证、API配置......一整套从0搞下来,光是门槛就足以把90%的人拦在门外。我的评论区和私聊,几乎每周都有人在问这些问题。

所以当我最近发现一个国内的Agent,给了我同样、甚至更顺畅的感觉时,我是真的有点兴奋。

它叫天工超级智能体,最近刚做了一次大升级。开箱即用、生态完善、全模态一站搞定,有些地方甚至比海外Agent还要顺手。

对于任何人来说,稳定才是生产力的前提。

正好我在用Agent进一步完善我的创作工作流(自媒体分发流程),没想到天工做得还真不错。

同时,这个想法在我今天参加了谁能成为百万博主的活动后,更强烈了。

就是做公众号的博主,怎么把其他平台做起来,比如视频号,小某书等等。

有时候,不是不想做,是精力不够。所以,在AI时代,我希望用Agent来帮我。

所以就有了我今天要分享的skill:repurpose-article skill,或者说一套分发工作流。

先看看天工是个啥

先用一句话讲清楚:天工是一个云端AI团队平台。你在输入框下达目标,它会自动调度多个专家智能体帮你干活。

你可能会问:这和我自己搭一套龙虾(Open Claw那一类)有啥区别?

区别可太大了。

跟龙虾这些海外Agent,甚至是国内一些本机上龙虾产品不同的是,天工完全不用部署、不用装环境、不用配API Key、不用买主机,注册就能用。

它内置了6大专家级技能:文档、PPT、图片、表格、网页、视频。这些技能会自动搭配着用,按你说出自己的需求,天工自己判断该调用哪些技能、按什么顺序来。

模型这块我看了一下,还挺猛的。主调度模型有DeepSeekV4 Pro、GLM-5.1、Kimi-2.6、MiniMax-2.7、Qwen3.6-Plus,都是国内一线旗舰模型。

视频模型更离谱,直接内置了Seedance 2.0和可灵3.0。

Seedance 2.0大家应该知道的,世界第一的视频生成模型。现在天工直接给装上了,能在Agent里面自由使用。

同时,小龙虾有的,天工超级Agent也支持,比如定时任务+飞书直连。你可以设好时间和频率,让AI按你的节奏主动推进工作,做完之后直接把结果推到你的飞书。

设定好任务,该干嘛干嘛去,到点了打开飞书,活干完了,你只管收菜就行~

跑真实业务

光说不练假把式。

我其实一直都在做AI辅助创作提效,为的就是尽可能实的把自己的工作中除了人的部分全部交给AI来完成,我最近做了一个repurpose-article Skill。

它的功能很简单:把一篇公众号文章链接丢进去,自动转化成小红书图文、视频、可视化网站、PPT四件套。

在接入天工超级Agent使用之前,功能其实有些单薄。小红书图文还好,视频这块用的是Agent转hyperframes,效果也还行,但毕竟还是HTML转视频,没有那么流畅,有时候有点像动态的PPT。

但如果是借助天工超级智能体的专家技能和Skills市场就不一样了。

现在我一篇文章链接丢进去,四种内容格式并行出来(小红书、视频、网页、PPT)。

就拿我之前那篇AI的开源项目Prompt 4万Star开源神作曝光顶级AI们的System Prompt来看看。

我把文章链接丢给天工,让它按repurpose-article的流程执行。

然后,很有意思的事情来了。

天工先读取了文章内容,然后开始Skill的流程拆成了四套子任务,它把四个物的生成任务拆成了并行的子任务,同时在跑。

我盯着看了一会,左边的对话里面一步步执行:先用脚本生成article.json和初始骨架,然后同时启动小红书、视频、网站和PPT四个子任务。

这个多线程的感觉,是真爽。

小红书图文:直接出片

先看小红书:天工根据文章内容,自动规划了一套小红书卡片。

会先生成三张封面图,然后用户选中一种,再继续生成。

下图我就选中了Data Pop风格,然后它就能很高效的批量生成。

Style锁定为Data Pop。现在批量生成卡片,每张都以定制封面为模板。

最后它把这些卡片全部生成出来了,完全就是小红书风格,直接就能发。

而且这里有个做得不错的细节:天工生成的这些图片,在天工里面是可以拆分元素编辑的。

你觉得哪张卡片文字不对、颜色不好,直接在天工里改,不用出来改。这个体验真的太好啦。

视频:从分镜到成片一条龙做完

然后是视频。这块以前是很头疼的------文章转视频,怎么拆成画面镜头、旁白怎么匹配、节奏怎么掌握、画面怎么生成,以前每一步、每个环节都是孤立的。

还好天工现在把这一串全包了。

它先按Skill里的视频流程,把文章拆成分镜脚本,每个镜头标好了时长、画面提示词、镜头运动、旁白金文案、屏幕文字。这套结构化的分镜直接喂给Seedance 2.0生成画面。

效果如下(作为科普视频,还不错):

然后在旁白这块也没让我失望。天工直接调了语音模型把旁白生成出来,配合每个镜头的时长自动对齐,你不用自己去录、也不需要开第三方配音工具。

更让我惊讶的是,第一版10个生成音频都有滴滴声,但是人工剪辑我觉得太麻烦了。当我告诉天工的时候,它直接识别到了滴滴声,帮我把每段音频1.2s的滴滴声给剪掉了,这活干的太漂亮了~

然后我发现居然还能针对生成的视频,直接在天工上进行剪辑

跟剪映一样,时间线、字幕、转场、滤镜、音频素材都能配置和修改,不用再导出来切到剪映里二次加工。

最后所有镜头拼起来,加上字幕、转场:一条可以直接发的短视频就出来了。

对于起号阶段的号来说,这是最轻量化的试错方式。

我以前用别的工具做这种视频,可能要在3个工具之间来回切:AI chat工具、视频生成工具、剪辑工具。

目前天工一条线下来全干完了,这种"端到端"的体验,在国内Agent里也是很少见的。

可视化网站

让天工顺便帮我把这篇文章做成了一个漂亮的可视化的静态网站。

而且直接部署好了,给了我一个可以访问的URL。

PPT 演示稿

第四个是PPT。天工先生成了一个7页的PPT大纲,然后调用了pptx技能生成高质量的演示文稿。

这个PPT我觉得有个很牛的点:它不是简单地把文章内容粘过去,是会根据Skill的指令精准拆解文章,挑出最适合做PPT的部分。

比如它把Grok的6种角色模式拿出来做了独立页面,甚至复用了文章中的插图。

目前小红书卡片、视频、网站、PPT,全部都能在天工里直接编辑。

图片可以拆分元素修改,网站可以看源码改代码,PPT可以直接调整内容,这个全模态编辑器是我目前在国内Agent平台里还没见第二家有的👏

「最后」

这套四件套如果我一个个手动做------小红书排版、视频分镜、搭网站、做PPT,至少要花一整天。

现在天工就能全搞定,甚至是并行完成。

当然也不是完美的,比如小红书卡片的配色、文字偶尔需要手动调一下,PPT的排版有时候会有点瑕疵。但整体的出品已经很高了,十个产物里至少七八个能直接用。

而且就算有点问题,也可以通过天工的全模态编辑器快速修正。

现在大家离Agent越来越近了,但说实话,真正能把龙虾用好的人很少。我身边不少朋友,龙虾装上玩了几天,就吃灰了。

因为对于很多人来说,配环境、出了bug不知道怎么修、而且模型API切换也不方便。

我觉得下一个阶段好的Agent,一定是让普通人也能低门槛地把Agent用好,真正解决日常碰到的各种复杂问题和重复工作。

天工这次升级,至少让我看到了这一个可能:不用装环境、不用配API、不用买主机,打开浏览器就能拥有一支工作稳定的云端Agent团队。

感兴趣的朋友可以体验一下。

另外,本篇用到的Skill,目前还在打磨中,计划后续优化得更好之后开源。大家帮忙多多三连,我尽快优化,并开源🥳

我是袋鼠帝,一个致力于帮你把AI变成生产力的博主。

我们下期见~

能看到这里的都是凤毛麟角的存在!

如果觉得不错,随手点个赞、在看、转发三连吧✨

如果想第一时间收到推送,也可以给我个星标⭐

谢谢你耐心看完我的文章~

相关推荐
牛奶6 小时前
Google 说 AI 能"解决所有疾病",我差点就信了
人工智能·机器人·aigc
掌动智能7 小时前
从“感知”到“认知”:RunnerAgent如何重塑UI自动化的稳定边界
人工智能·ui·自动化
玄米乌龙茶1237 小时前
LLM成长笔记(十):多模态应用开发
人工智能·笔记·语音识别
逻辑君7 小时前
物理生物学研究报告【20260015】
人工智能·物理
用户5191495848457 小时前
Laravel 加密密钥批量扫描与 CVE-2024-55555 漏洞检测工具
人工智能·aigc
Keano Reurink7 小时前
SEO数据管道:用Airflow搭建自动化工作流
运维·人工智能·爬虫·搜索引擎·自动化·ai编程·seo
生成论实验室7 小时前
用事件关系网络重新理解AI(二):损失函数、优化器与深度学习的动力学
数据结构·人工智能·深度学习·算法·语言模型
韦胖漫谈IT7 小时前
提示词注入- 大语言模型 OWASP TOP 10系列
网络·人工智能·语言模型·大模型安全·owasp
HIT_Weston7 小时前
93、【Agent】【OpenCode】edit 工具提示词(二)
人工智能·agent·opencode