docker安装MoneyPrinterTurbo,实现文本转视频的本地私有化部署

一、背景

前文我们已经搭建了文本转图片、文本转音频两种转换工具,尚缺文本转视频的这种工具。

想要把文本转为视频,需要以下几个素材:

  • 1、主题(包括文案、关键字)
  • 2、插图
  • 3、音频
  • 4、字幕
  • 5、背景音乐

本文将通过部署MoneyPrinterTurbo,搭建一套本地AI视频生成工具。

二、部署

从官网github拉取项目,包括代码、Dockerfile、docker-compose.yml、config.example.toml等等

github项目地址

1、修改配置文件

bash 复制代码
cp config.example.toml config.toml
  • 视频里的插图素材,来自于pexels,需要获取其apikey。
  • 选择一款LLM, 这里以kimi为例,填写其apikey和model。

示例:

2、运行容器

bash 复制代码
cd MoneyPrinterTurbo
docker compose up -d

其docker镜像比较大,当然远比前文说的index-tts小多了。

三、pexels

pexels是一个开放免费的素材库,可供AI检索,用于生成视频的插图。

四、kimi大模型

进入moonshot开发控制台

https://platform.moonshot.cn/console/api-keys

生成apikey,为MoneyPrinterTurbo所用。

复制这里的apikey至config.toml文件里。

每个注册账户会被分配15元的免费额度,供开发自用。

五、生成视频

访问首页UI:http://localhost:8501/

基础配置,可以看到你所使用的LLM等信息

1、主题(包括文案、关键词)

输入主题,用「场景+主体+动作+风格」四段式代替一句话

点击使用AI根据主题生成【视频文案】和【视频关键词】

2、插图

可以上传本地文件,默认是从Pexels素材库搜索而得。

如果是本地文件,你可以上传mp4文件,也可以上传图片等。

3、音频

根据第一步生成的文案,调用Azure TTS文本转语音服务,生成视频的音频。

注意,这里要选择zh-CN等汉语朗读的声音。

如果你选择的是其他语言,而第一步输入的又是汉字,那么可能会导致生成视频失败。

4、字幕

5、背景音乐

选择本地的文件作为背景音乐。

配置完成,点击底部的"生成视频"。

结果发现,生成的视频经常是画面与文案不搭。

MoneyPrinterTurbo 仅做「关键词-素材库搜索」而不做「视觉语义理解」。

它的大致流程是:

  • 大模型把文案拆成几个关键词。
  • 用关键词去 Pexels / Pixabay 搜索 标签匹配 的素材。
  • 按时间轴简单拼接,不做二次校验。

想要让MoneyPrinterTurbo更好地做到「视觉语义理解」,建议是本地上传素材。

把「素材来源」改成 Local,然后把与文案一一对应的图片/短视频按 01.jpg 02.jpg ... 命名,上传到 ~/moneyprinter-data/images/,项目会按文件名顺序直接引用,100% 贴合。

「视频拼接模式」选择"顺序拼接"。

相关推荐
源代码•宸42 分钟前
分布式缓存-GO(分布式算法之一致性哈希、缓存对外服务化)
开发语言·经验分享·分布式·后端·算法·缓存·golang
It's now1 小时前
Spring AI 基础开发流程
java·人工智能·后端·spring
计算机毕设VX:Fegn08951 小时前
计算机毕业设计|基于springboot + vue图书商城系统(源码+数据库+文档)
java·数据库·vue.js·spring boot·后端·课程设计
CAFEBABE 341 小时前
linux离线安装docker并启动
linux·docker·eureka
夕颜1112 小时前
BeeAI 框架学习记录
后端
极市平台2 小时前
骁龙大赛-技术分享第5期(上)
人工智能·经验分享·笔记·后端·个人开发
程序员爱钓鱼3 小时前
Node.js 编程实战:路由处理原理与实践
后端·node.js·trae
爱笑的眼睛113 小时前
FastAPI 路由系统深度探索:超越基础 CRUD 的高级模式与架构实践
java·人工智能·python·ai
张彦峰ZYF4 小时前
AI赋能原则6解读思考:深度专业、跨界能力与工具协同的复合竞争力-AI时代的人才新逻辑
人工智能·ai·ai赋能和落地
yuguo.im4 小时前
Docker 两大基石:Namespace 和 Cgroups
运维·docker·容器