你的Agent🦞也能做电影了!

这是苍何的第 510 篇原创!

大家好,我是苍何。

我的 Agent🦞团队,继续进化,特别是内容总监🦞的进化速度最为惊人。

他现在除了掌握小红书、公众号等的文章创作,还学会了图片、音频、视频的全域创作。

之前他做视频,基本就是单个镜头的生成,画面可以,但你要说把它们串成一个完整的故事,那还差得远。

今天我给他装了一套新的 Skill,叫 LibTV。

装完之后,好家伙,这货直接开窍了。

给他一个主题,他自己就能编排工作流,从写剧本、拆分镜、生成画面到剪辑配音,一条龙全给你安排上。

除了直接给视频成品,可以看到在 LibTV 平台无限画布内有 Agent 完成的所有素材及工作流编排。

而且生成出来的画面,角色一致性、镜头连贯性,比之前强了不止一个档。

我随手让他做了一个短片,你们感受一下:

提示词:帮我生成 1 分钟的短漫剧,主题为未来碳基生命和硅基生命共存的场景,国风动漫风格

这个视频的所有工作流,全部由 Agent 自主调用 LibTV Skill 完成,剧本、分镜图片、分镜视频,以及最后的合成,都一气呵成。

说实话,我最喜欢这个配乐,还真不错啊。

同样让他做一个短漫剧,主题为一家三口在童话小镇快乐玩的场景,吉卜力动漫风格,效果如下:

打开这个视频的无线画布,看到支持生图生视频的模型非常全面,可以说汇聚全球顶尖的模型了。

我看了 Agent 会自主去选择参照图保持主体及人物场景的一致性。

如果觉得哪个节点不符合条件,人类也可以凭借自己感觉手动去调整控制,比如摄像机镜头、焦距、光圈等,都可以调整。

对于分镜图可以对图片进行扩图、多角度、打光、重绘、抠图等。

当然🦞也能自己根据要求自己选择,人类可以凭自己的经验指挥你的龙虾或者手动调整。

这个视频不能说很完美吧,比如说最后来了两个妈妈,直接就把我吓了一跳,不过整体画面的唯美,我好喜欢啊。

如果你看到了这里,那恭喜你,我想给你看个我用内容总监🦞一句话做出的茶π的 TVC 广告。

我只给了一张产品参考图,以及一句话,我就去打爆竹去了。

他做好了飞书发到我手机提醒,还给了我个画布链接,点进去,也能看到整个创作的工作流。

这样的片子,要放以前,请演员,摆道具,拍视频,配音剪辑,少说也得好几天吧,成本没个几万搞不定吧?我现在 5 分钟,一次直出,看了下成本,算下来差不多几块钱。

真是有点惊艳到我。

我还上传了一个我喜欢的音乐和一张照片,通过无限画布,让他帮我直出一段 MV。

运镜和人物一致性都比较不错。

我还让我的运营总监🦞帮我做了个守株待兔的漫画视频:

我家小兔寨子这两天想听姜饼人的故事,我直接就让他做个视频给小朋友看吧:

说实话,要不是他们这个 LibTV 今天🔥了,一堆人在用,现在开始排队生成有点儿慢了,我还能玩的更嗨。**

**

我觉得 LibTV 大概率是现阶段最适合专业创作者和 Agent 的 AI 视频工具了。

玩了一整天,我也去了解了一下这个产品的背景。

LibTV 是 LiblibAI 做的第一款 AI 视频产品,说白了就是他们看到了一个问题:现在市面上的 AI 视频工具,要么太简单,Agent 能聊但做不出复杂作品;要么太复杂,纯节点工作流搭起来成本贼高。

更烦的是,你生成完一个镜头,想微调一下?不好意思,导出去,换个工具,再导回来。流程被切得稀碎。

所以他们从第一天开始就做了一个我觉得很有意思的设计:「双入口」

一款产品,两扇正门。

一扇给人类创作者,就是你看到的那个无限画布,节点式工作流,从剧本到分镜到成片,所有精细控制都在里面。

另一扇给 Agent,通过 Skill 接口直接理解任务、调用模型、自动编排工作流。

这也是为什么我的🦞装上 Skill 之后就能直接干活,因为这个产品本来就是给他准备了一扇门的。

再说说模型,LibTV 集成了全网主流的图像和视频模型,而且据说马上会上线 seedance2 的独家入口,这个还是挺期待的。

还有一个让我比较意外的点是价格。

视频创作最费钱的就是反复试,创作者管这叫「抽卡」。LibTV 的定价确实挺狠的,年卡最低 3.9 折,部分模型叠加优惠算下来 2 折多。而且订阅就送 150 条可灵 O3 加 150 条可灵 3.0,一共 300 条最高等级的视频额度,量大管饱。

bash 复制代码
官网:https://www.liblib.tv/GitHub:https://github.com/libtv-labs/libtv-skills

当然了,也得说说不足的地方。

LibTV 还在内测阶段,体验下来还是有一些小 bug 的,偶尔会遇到生成失败的情况。而且今天用的人太多了,排队等生成的时间明显变长,着急的时候确实有点上头。

另外 Agent 端的 Skill 还在持续开发中,现在已经有短漫剧、爆款视频复刻、音乐 MV 这些,但更多场景的能力还没有搞好。

不过话说回来,这东西的潜力是真的大。

他们提了一个观点我还挺认同的:「过去 20 年,所有软件都是先做 GUI 给人用,做大了再开放 API。但 Agent 时代,API 从第一天起就和 GUI 同等重要。」

这其实就是软件长出了「第二扇门」。

以前产品只研究怎么让人更容易上手,现在还得同时研究怎么让 Agent 更容易调用。LibTV 算是在视频创作这个领域,第一个吃螃蟹的。

我自己的感受是,真正决定一个作品好不好的,还是人的审美和判断。AI 再强,它生成的东西如果没有人的选择在里面,可能技术上啥毛病没有,但就是没有灵魂。

而 LibTV 做的事情,就是让人负责选择和审美,Agent 负责执行和扩展。

人在创作,Agent 在学习,工具在进化,三件事同时发生。

这才是我觉得它真正有意思的地方。

相关推荐
Soofjan2 小时前
GMP 源码(下):调度循环、抢占与 syscall
后端
苍何2 小时前
一人公司,我雇了 6 个 AI 龙虾总监
后端
颜酱2 小时前
回溯算法专项突破练习(1)
javascript·后端·算法
Soofjan2 小时前
GMP 源码(上):结构、启动与创建 G
后端
sxhcwgcy2 小时前
快速在本地运行SpringBoot项目的流程介绍
java·spring boot·后端
掘金者阿豪2 小时前
在AI时代,没有人是“只写一行代码的人”——我们为何都在被迫成为全栈?
vue.js·后端
LucianaiB2 小时前
再见Openclaw,我找到了比Openclaw更好玩的了!(附赠工具)
后端
2501_943610362 小时前
我爱导航系统美化版源码网址导航系统带后台-【全开源】
前端·后端·html·php