AI一键生成短视频

AI一键生成推文短视频

阅读时长:10分钟

本文内容: 结合开源AI,一键生成短视频发布到常见的某音,某手平台,狠狠赚一笔

前置知识:

1.基本的 python 编程知识

2.chatGPT 使用过

3.stable diffution 使用过

成果展示

技术要点

环境要求:

  • python: 3.10.6
  • GPU: 显存最低8G
  1. 文本处理

文本语义分析采用 清华大学开源的 chatGLM2-6B,当然本地部署也可以使用Meta开源的 Llama2-7B,但是这个中文的支持不太好。

  1. 音频生成

音频合成 我采用的是百度的 Baidu-tts, 当然如果你有条件最好使用微硬的tts,效果好很多。

  1. 图片生成

图片生成,没有其他可选项,就是开源的 stable diffution,目前市面上有2个webui,最流行的是B站秋叶的stable diffution webui

  1. 视频合成

1)视频合成使用python包moviepy

2)安装两个额外的软件: imagemagick 和 强大的 FFmpeg_Full.msi 👈

虽然 imagemagick 内置了一个 FFmpeg,但是版本比较低 4.4.3,因此直接安装一个 FFmpeg 并设置环境变量

项目源码

  • 即将发布

------ 如果文章对你有用,感谢右上角 >>>点赞 | 收藏 <<<

相关推荐
风象南42 分钟前
普通人用AI加持赚到的第一个100块
人工智能·后端
牛奶1 小时前
2026年大模型怎么选?前端人实用对比
前端·人工智能·ai编程
牛奶1 小时前
前端人为什么要学AI?
前端·人工智能·ai编程
罗西的思考4 小时前
AI Agent框架探秘:拆解 OpenHands(10)--- Runtime
人工智能·算法·机器学习
冬奇Lab5 小时前
OpenClaw 源码精读(2):Channel & Routing——一条消息如何找到它的 Agent?
人工智能·开源·源码阅读
冬奇Lab5 小时前
一天一个开源项目(第38篇):Claude Code Telegram - 用 Telegram 远程用 Claude Code,随时随地聊项目
人工智能·开源·资讯
格砸6 小时前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化
前端·人工智能·后端
可观测性用观测云6 小时前
可观测性 4.0:教系统如何思考
人工智能
sunny8657 小时前
Claude Code 跨会话上下文恢复:从 8 次纠正到 0 次的工程实践
人工智能·开源·github
小笼包包仔7 小时前
OpenClaw 多Agent软件开发最佳实践指南
人工智能