9K star!利用 AI 大模型,一键生成高清短视频。效果还可以

原文链接: 9K star!利用 AI 大模型,一键生成高清短视频。效果还可以

现在失业三件套就是滴滴,外卖和自媒体,而且视频赛道也越来越卷了。

每一个搞自媒体的同学肯定都希望能有一个自动生成视频,或者剪辑的工具。

今天给大家介绍一个开源项目,就是可以根据一个主题或者关键词生成视频。

这个项目目前还是非常活跃的,项目使用 Python 开发,框架用的 FastAPI。不得不说,这个框架现在越来越多被使用了。

项目简介

只需提供一个主题关键词 ,就可以全自动生成视频文案、素材、字幕、还有背景音乐,然后合成一个高清的短视频。

功能特性:

  • 完整的 MVC 架构 ,代码 结构清晰 ,易于维护,支持 APIWeb 界面
  • 支持视频文案 AI 自动生成 ,也可以自定义文案
  • 支持多种 高清视频 尺寸
    • 竖屏 9:16,1080x1920
    • 横屏 16:9,1920x1080
  • 支持 批量视频生成,可以一次生成多个视频,然后选择一个最满意的
  • 支持 视频片段时长设置,方便调节素材切换频率
  • 支持 中文英文 视频文案
  • 支持 多种语音 合成
  • 支持 字幕生成 ,可以调整 字体位置颜色大小,同时支持字幕描边设置
  • 支持 背景音乐 ,随机或者指定音乐文件,可设置背景音乐音量
  • 视频素材来源 高清 ,而且 无版权
  • 支持 OpenAImoonshotAzuregpt4freeone-api通义千问Google GeminiOllama 等多种模型接入

我体验了一下,页面操作起来还是很方便的,傻瓜式操作。

如果不自己写文案的话,基本就写一个主题或者关键词就可以了,基本一分钟左右就可以生成一个 30s 左右的视频。

现在的素材都是程序自动从网上下载的,我看已经有人提 issue 说是不是可以支持使用自己的素材,这个点我还是很期待的。

重点是作者也列入到后期计划了。

项目部署

部署很方便,README 写的也很清楚。可以直接用安装包,手动部署,就是 Python 项目部署那一套逻辑,先建虚拟环境,再装包。

还支持 Docker 方式部署,这也是我选择的方式,下面就详细介绍一下。

直接到项目目录下执行:

bash 复制代码
docker-compose up

如果遇到安装系统包失败的问题:

bash 复制代码
Unable to connect to deb.debian.org

可以通过修改 Dockerfile,改变镜像源的方法解决:

bash 复制代码
RUN echo "deb http://deb.debian.org/debian buster main" > /etc/apt/sources.list
RUN sed -i 's/deb.debian.org/mirrors.aliyun.com/g' /etc/apt/sources.list

当使用中文主题生成视频时,遇到了下面这个问题,英文的话是正常的。

bash 复制代码
AttributeError: 'NoneType' object has no attribute 'get'

# 具体原因如下:
failed to generate audio, maybe the network is not available. 
if you are in China, please use a VPN.

我没有深究背后的原因,如果只是测试的话,直接使用英文就行了。

项目使用

我部署的是最新版本 v1.1.0,具体的页面就是上文提到的那样。

总共就分了四块,分别是设置文案,视频,音频和字幕。

必填的其实只有主题,像文案都可以根据主题自动生成,其他的设置基本都是简单选一选,点一点就可以了。

后端日志输出也很丰富,从日志可以看到,程序会根据主题搜索素材,然后下载视频。

接下来就是把下载的视频剪辑,再根据 AI 的文案合成一个最终版视频,并在页面上提供了下载功能。

关注我,持续为大家分享 AI 领域的开源项目。

项目地址: github.com/harry0703/M...

相关推荐
火山引擎边缘云2 小时前
豆包 1.5 · 深度思考模型上线边缘大模型网关,百万 Tokens 免费领
llm·aigc·边缘计算
Bryan_Long3 小时前
Git 命令行操作提交至远程仓库
git·github
muyouking113 小时前
3.Rust + Axum 提取器模式深度剖析
前端·rust·github
量子位3 小时前
飞猪 AI 意外出圈!邀请码被黄牛倒卖,分分钟搞定机酒预订,堪比专业定制团队
人工智能·llm·aigc
量子位3 小时前
趣丸科技贾朔:AI 音乐迎来应用元年,五年内将重构产业格局|中国 AIGC 产业峰会
人工智能·aigc
量子位3 小时前
粉笔 CTO:大模型打破教育「不可能三角」,因材施教真正成为可能|中国 AIGC 产业峰会
人工智能·aigc
小华同学ai4 小时前
15.4K Star!Vercel官方出品,零基础构建企业级AI聊天机器人
github
蚝油菜花5 小时前
让AI听懂你的建模需求!BlenderMCP:自然语言指令直接操控 Blender,一句话生成复杂3D场景
人工智能·开源
蚝油菜花5 小时前
自然语言生成代码一键搞定!Codex CLI:OpenAI开源终端AI编程助手,代码重构+测试全自动
人工智能·开源
三道杠卷胡5 小时前
【AI News | 20250417】每日AI进展
人工智能·pytorch·python·语言模型·github