AI一键生成短视频

AI一键生成推文短视频

阅读时长:10分钟

本文内容: 结合开源AI,一键生成短视频发布到常见的某音,某手平台,狠狠赚一笔

前置知识:

1.基本的 python 编程知识

2.chatGPT 使用过

3.stable diffution 使用过

成果展示

技术要点

环境要求:

  • python: 3.10.6
  • GPU: 显存最低8G
  1. 文本处理

文本语义分析采用 清华大学开源的 chatGLM2-6B,当然本地部署也可以使用Meta开源的 Llama2-7B,但是这个中文的支持不太好。

  1. 音频生成

音频合成 我采用的是百度的 Baidu-tts, 当然如果你有条件最好使用微硬的tts,效果好很多。

  1. 图片生成

图片生成,没有其他可选项,就是开源的 stable diffution,目前市面上有2个webui,最流行的是B站秋叶的stable diffution webui

  1. 视频合成

1)视频合成使用python包moviepy

2)安装两个额外的软件: imagemagick 和 强大的 FFmpeg_Full.msi 👈

虽然 imagemagick 内置了一个 FFmpeg,但是版本比较低 4.4.3,因此直接安装一个 FFmpeg 并设置环境变量

项目源码

  • 即将发布

------ 如果文章对你有用,感谢右上角 >>>点赞 | 收藏 <<<

相关推荐
海豚调度5 分钟前
Linux 基金会报告解读:开源 AI 重塑经济格局,有人失业,有人涨薪!
大数据·人工智能·ai·开源
T__TIII10 分钟前
Dify 插件非正式打包
人工智能
jerwey15 分钟前
大语言模型(LLM)按架构分类
人工智能·语言模型·分类
令狐少侠201125 分钟前
ai之RAG本地知识库--基于OCR和文本解析器的新一代RAG引擎:RAGFlow 认识和源码剖析
人工智能·ai
小叮当爱咖啡30 分钟前
Seq2seq+Attention 机器翻译
人工智能·自然语言处理·机器翻译
shadowcz00730 分钟前
奥特曼论人工智能、OpenAI与创业
人工智能·百度
AI人工智能+42 分钟前
应用俄文OCR技术,为跨语言交流与数字化管理提供更强大的支持
人工智能·ocr·文字识别
UQI-LIUWJ1 小时前
李宏毅LLM笔记: AI Agent
人工智能·笔记
百度Geek说1 小时前
百度阮瑜:百度大模型应用赋能产业智变|2025全球数字经济大会
人工智能
大明哥_1 小时前
最新 Coze 教程:40+ 条视频涨粉 10W+,利用 Coze 工作流 + 视频组件,一键制作爆款小人国微景动画视频
人工智能·agent