AI一键生成短视频

AI一键生成推文短视频

阅读时长:10分钟

本文内容: 结合开源AI,一键生成短视频发布到常见的某音,某手平台,狠狠赚一笔

前置知识:

1.基本的 python 编程知识

2.chatGPT 使用过

3.stable diffution 使用过

成果展示

技术要点

环境要求:

  • python: 3.10.6
  • GPU: 显存最低8G
  1. 文本处理

文本语义分析采用 清华大学开源的 chatGLM2-6B,当然本地部署也可以使用Meta开源的 Llama2-7B,但是这个中文的支持不太好。

  1. 音频生成

音频合成 我采用的是百度的 Baidu-tts, 当然如果你有条件最好使用微硬的tts,效果好很多。

  1. 图片生成

图片生成,没有其他可选项,就是开源的 stable diffution,目前市面上有2个webui,最流行的是B站秋叶的stable diffution webui

  1. 视频合成

1)视频合成使用python包moviepy

2)安装两个额外的软件: imagemagick 和 强大的 FFmpeg_Full.msi 👈

虽然 imagemagick 内置了一个 FFmpeg,但是版本比较低 4.4.3,因此直接安装一个 FFmpeg 并设置环境变量

项目源码

  • 即将发布

------ 如果文章对你有用,感谢右上角 >>>点赞 | 收藏 <<<

相关推荐
Tadas-Gao15 分钟前
Mem0分层记忆系统:大语言模型长期记忆的架构革命与实现范式
人工智能·语言模型·自然语言处理·架构·大模型·llm·transformer
极客小俊21 分钟前
Windows 卸载 OpenClaw
人工智能
吴佳浩 Alben23 分钟前
GPU 生产环境实践:硬件拓扑、显存管理与完整运维体系
运维·人工智能·pytorch·语言模型·transformer·vllm
多年小白24 分钟前
OpenClaw 本周技术更新速递
人工智能·ai·ai编程·openclaw
深瞳智检39 分钟前
lesson-02 NLP 基础-文本表示与词向量
人工智能·自然语言处理·llm·大语言模型
twc8292 小时前
大模型生成 QA Pairs 提升 RAG 应用测试效率的实践
服务器·数据库·人工智能·windows·rag·大模型测试
宇擎智脑科技2 小时前
A2A Python SDK 源码架构解读:一个请求是如何被处理的
人工智能·python·架构·a2a
IT_陈寒2 小时前
Redis缓存击穿:3个鲜为人知的防御策略,90%开发者都忽略了!
前端·人工智能·后端
电商API&Tina2 小时前
【电商API接口】开发者一站式电商API接入说明
大数据·数据库·人工智能·云计算·json
湘美书院--湘美谈教育2 小时前
湘美谈教育湘美书院网文研究:人工智能与微型小说选集
人工智能·深度学习·神经网络·机器学习·ai写作