AI一键生成短视频

AI一键生成推文短视频

阅读时长:10分钟

本文内容: 结合开源AI,一键生成短视频发布到常见的某音,某手平台,狠狠赚一笔

前置知识:

1.基本的 python 编程知识

2.chatGPT 使用过

3.stable diffution 使用过

成果展示

技术要点

环境要求:

  • python: 3.10.6
  • GPU: 显存最低8G
  1. 文本处理

文本语义分析采用 清华大学开源的 chatGLM2-6B,当然本地部署也可以使用Meta开源的 Llama2-7B,但是这个中文的支持不太好。

  1. 音频生成

音频合成 我采用的是百度的 Baidu-tts, 当然如果你有条件最好使用微硬的tts,效果好很多。

  1. 图片生成

图片生成,没有其他可选项,就是开源的 stable diffution,目前市面上有2个webui,最流行的是B站秋叶的stable diffution webui

  1. 视频合成

1)视频合成使用python包moviepy

2)安装两个额外的软件: imagemagick 和 强大的 FFmpeg_Full.msi 👈

虽然 imagemagick 内置了一个 FFmpeg,但是版本比较低 4.4.3,因此直接安装一个 FFmpeg 并设置环境变量

项目源码

  • 即将发布

------ 如果文章对你有用,感谢右上角 >>>点赞 | 收藏 <<<

相关推荐
草莓熊Lotso29 分钟前
Git 分支管理:从基础操作到协作流程(本地篇)
大数据·服务器·开发语言·c++·人工智能·git·sql
youngfengying33 分钟前
Swin Transformer
人工智能·深度学习·transformer
User_芊芊君子33 分钟前
光影协同:基于Rokid CXR-M SDK构建工业级远程专家协作维修系统
人工智能
摘星编程34 分钟前
AI文物复活馆:基于 AiOnly 一键调用 Claude 4.5 + Gemini 3 Pro 的多模态复原神器
人工智能·aionly
AI绘画哇哒哒2 小时前
【收藏必看】大模型智能体六大设计模式详解:从ReAct到Agentic RAG,构建可靠AI系统
人工智能·学习·ai·语言模型·程序员·产品经理·转行
CNRio2 小时前
人工智能基础架构与算力之3 Transformer 架构深度解析:从注意力机制到算力适配演进
人工智能·深度学习·transformer
qy-ll3 小时前
深度学习——CNN入门
人工智能·深度学习·cnn
青瓷程序设计6 小时前
动物识别系统【最新版】Python+TensorFlow+Vue3+Django+人工智能+深度学习+卷积神经网络算法
人工智能·python·深度学习
金智维科技官方7 小时前
RPA财务机器人为企业高质量发展注入动能
人工智能·机器人·rpa·财务
沫儿笙7 小时前
安川机器人tag焊接怎么节省保护气
人工智能·物联网·机器人