AI一键生成短视频

AI一键生成推文短视频

阅读时长:10分钟

本文内容: 结合开源AI,一键生成短视频发布到常见的某音,某手平台,狠狠赚一笔

前置知识:

1.基本的 python 编程知识

2.chatGPT 使用过

3.stable diffution 使用过

成果展示

技术要点

环境要求:

  • python: 3.10.6
  • GPU: 显存最低8G
  1. 文本处理

文本语义分析采用 清华大学开源的 chatGLM2-6B,当然本地部署也可以使用Meta开源的 Llama2-7B,但是这个中文的支持不太好。

  1. 音频生成

音频合成 我采用的是百度的 Baidu-tts, 当然如果你有条件最好使用微硬的tts,效果好很多。

  1. 图片生成

图片生成,没有其他可选项,就是开源的 stable diffution,目前市面上有2个webui,最流行的是B站秋叶的stable diffution webui

  1. 视频合成

1)视频合成使用python包moviepy

2)安装两个额外的软件: imagemagick 和 强大的 FFmpeg_Full.msi 👈

虽然 imagemagick 内置了一个 FFmpeg,但是版本比较低 4.4.3,因此直接安装一个 FFmpeg 并设置环境变量

项目源码

  • 即将发布

------ 如果文章对你有用,感谢右上角 >>>点赞 | 收藏 <<<

相关推荐
ccut 第一混7 分钟前
c# 使用yolov5模型
人工智能·深度学习
PHOSKEY8 分钟前
应用案例丨3D工业相机如何实现「焊接全工序守护」
人工智能
喜欢吃豆36 分钟前
从指令到智能:大型语言模型提示词工程与上下文工程的综合分析
人工智能·语言模型·自然语言处理·大模型·提示词工程·上下文工程
Fuly102440 分钟前
prompt构建技巧
人工智能·prompt
XXX-X-XXJ1 小时前
二:RAG 的 “语义密码”:向量、嵌入模型与 Milvus 向量数据库实操
人工智能·git·后端·python·django·milvus
艾醒(AiXing-w)1 小时前
探索大语言模型(LLM):大模型微调方式全解析
人工智能·语言模型·自然语言处理
科兴第一吴彦祖1 小时前
基于Spring Boot + Vue 3的乡村振兴综合服务平台
java·vue.js·人工智能·spring boot·推荐算法
姚瑞南1 小时前
【AI 风向标】四种深度学习算法(CNN、RNN、GAN、RL)的通俗解释
人工智能·深度学习·算法
渡我白衣1 小时前
深度学习入门(一)——从神经元到损失函数,一步步理解前向传播(上)
人工智能·深度学习·学习
补三补四1 小时前
SMOTE 算法详解:解决不平衡数据问题的有效工具
人工智能·算法