9K star!利用 AI 大模型,一键生成高清短视频。效果还可以

原文链接: 9K star!利用 AI 大模型,一键生成高清短视频。效果还可以

现在失业三件套就是滴滴,外卖和自媒体,而且视频赛道也越来越卷了。

每一个搞自媒体的同学肯定都希望能有一个自动生成视频,或者剪辑的工具。

今天给大家介绍一个开源项目,就是可以根据一个主题或者关键词生成视频。

这个项目目前还是非常活跃的,项目使用 Python 开发,框架用的 FastAPI。不得不说,这个框架现在越来越多被使用了。

项目简介

只需提供一个主题关键词 ,就可以全自动生成视频文案、素材、字幕、还有背景音乐,然后合成一个高清的短视频。

功能特性:

  • 完整的 MVC 架构 ,代码 结构清晰 ,易于维护,支持 APIWeb 界面
  • 支持视频文案 AI 自动生成 ,也可以自定义文案
  • 支持多种 高清视频 尺寸
    • 竖屏 9:16,1080x1920
    • 横屏 16:9,1920x1080
  • 支持 批量视频生成,可以一次生成多个视频,然后选择一个最满意的
  • 支持 视频片段时长设置,方便调节素材切换频率
  • 支持 中文英文 视频文案
  • 支持 多种语音 合成
  • 支持 字幕生成 ,可以调整 字体位置颜色大小,同时支持字幕描边设置
  • 支持 背景音乐 ,随机或者指定音乐文件,可设置背景音乐音量
  • 视频素材来源 高清 ,而且 无版权
  • 支持 OpenAImoonshotAzuregpt4freeone-api通义千问Google GeminiOllama 等多种模型接入

我体验了一下,页面操作起来还是很方便的,傻瓜式操作。

如果不自己写文案的话,基本就写一个主题或者关键词就可以了,基本一分钟左右就可以生成一个 30s 左右的视频。

现在的素材都是程序自动从网上下载的,我看已经有人提 issue 说是不是可以支持使用自己的素材,这个点我还是很期待的。

重点是作者也列入到后期计划了。

项目部署

部署很方便,README 写的也很清楚。可以直接用安装包,手动部署,就是 Python 项目部署那一套逻辑,先建虚拟环境,再装包。

还支持 Docker 方式部署,这也是我选择的方式,下面就详细介绍一下。

直接到项目目录下执行:

bash 复制代码
docker-compose up

如果遇到安装系统包失败的问题:

bash 复制代码
Unable to connect to deb.debian.org

可以通过修改 Dockerfile,改变镜像源的方法解决:

bash 复制代码
RUN echo "deb http://deb.debian.org/debian buster main" > /etc/apt/sources.list
RUN sed -i 's/deb.debian.org/mirrors.aliyun.com/g' /etc/apt/sources.list

当使用中文主题生成视频时,遇到了下面这个问题,英文的话是正常的。

bash 复制代码
AttributeError: 'NoneType' object has no attribute 'get'

# 具体原因如下:
failed to generate audio, maybe the network is not available. 
if you are in China, please use a VPN.

我没有深究背后的原因,如果只是测试的话,直接使用英文就行了。

项目使用

我部署的是最新版本 v1.1.0,具体的页面就是上文提到的那样。

总共就分了四块,分别是设置文案,视频,音频和字幕。

必填的其实只有主题,像文案都可以根据主题自动生成,其他的设置基本都是简单选一选,点一点就可以了。

后端日志输出也很丰富,从日志可以看到,程序会根据主题搜索素材,然后下载视频。

接下来就是把下载的视频剪辑,再根据 AI 的文案合成一个最终版视频,并在页面上提供了下载功能。

关注我,持续为大家分享 AI 领域的开源项目。

项目地址: github.com/harry0703/M...

相关推荐
Jump 不二10 分钟前
揭秘腾讯 Ima 知识库架构:从开源 WeKnora 看 RAG + 知识图谱落地实践
人工智能·语言模型·架构·机器人·开源·知识图谱
合合技术团队26 分钟前
智能合同审查搭建教程:低质量PDF怎么处理?先解析清洗,再分路审阅(附GitHub项目地址)
pdf·prompt·github·textin
三无推导28 分钟前
深入解析 ComposioHQ/awesome-codex-skills:从 Prompt 复用到 AI 工程技能化的实践路径
人工智能·性能优化·开源·prompt·github
米小虾1 小时前
从"玩具"到"生产力":AI Agent 架构设计的 5 个关键决策
langchain·aigc·ai编程
xixixi777771 小时前
AI安全周记:AI驱动攻击占比50%、PQC国标落地、ShinyHunters连环袭击——面对1:25的攻防成本鸿沟,防守方还能撑多久?
人工智能·安全·ai·大模型·aigc·量子计算·供应链
oort1231 小时前
奥尔特云 VLStream 视觉 AI 平台采用 MIT 协议开源,贯通标注、训练、部署全流程,集成视频物联核心能力,支持私有化部署与多场景智能化应用
人工智能·开源
我是发哥哈1 小时前
三款主流AI视频生成模型商用能力对比与选型分析
大数据·人工智能·学习·ai·chatgpt·aigc·音视频
第一程序员1 小时前
2026年GitHub上最火的10个Python项目,Rust开发者必看
python·rust·github
wangruofeng2 小时前
AI 正在压垮 GitHub
github·aigc