这款开源AI神器,让视频创作进入"一句话生成大片"时代。

在短视频和内容创作大爆发的时代,如何快速将一个故事变成完整的视频?

传统方式需要撰写故事、寻找配图、添加音频、编辑字幕,整个流程费时费力。

虽然一些主流AI工具现也支持文字成片、故事创作等,但都是会员专属或积分制。

今天推荐一个Github上开源的一键生成完整故事场景的视频工具:Story-Flicks

只需输入一个简单的故事主题,就能自动生成一个包含完整剧情、精美图片、动听音频和字幕的高清视频。

它将繁琐的创作过程简化为"一键完成",无需专业技能,只需一个想法,就能让你的创意"动起来",让每个人都能成为故事Vlog创作者。

项目介绍

Story-Flicks 是一款由开发者 alecm20 开发并在 GitHub 上开源的 AI 视频生成工具。

它基于大语言模型(LLM)和图像生成技术,能够根据用户输入的故事主题,自动生成包含故事内容、图片、音频和字幕的完整高清视频。

通过集成多种 AI 模型和一键式操作,将复杂的视频制作过程浓缩为一个直观的工作流。

项目的后端采用 Python + FastAPI 框架,高效处理 AI 模型的调用和视频生成任务;前端则使用 React + Ant Design + Vite,提供简洁易用的用户界面。

核心能力

  • 自动生成完整故事视频:输入故事主题,就能直接生成完整的故事情节、配图、音频,并将其转换为视频。

  • 支持多种 AI 生成模型:集成多种主流文本及图像生成模型(GPT-4、千问、DeepSeek、Flux等)

  • 集成多种TTS服务:OpenAI TTS、Google TTS、Whisper等

  • 可自定义故事长度 & 结构:可设定故事段落数量,每个段落自动生成配图和配音。

安装使用

Story-Flicks 支持 Docker 一键部署,也可手动安装:

Docker 部署

bash 复制代码
git clone https://github.com/alecm20/story-flicks.git
cd story-flicks

docker-compose up --build

手动安装

后端项目启动步骤:

ini 复制代码
# 先切换到项目根目录
cd backend
conda create -n story-flicks python=3.10 # 这里使用 conda,其他的虚拟环境创建方式也可以
conda activate story-flicks
pip install -r requirements.txt
uvicorn main:app --reload

前端项目启动步骤:

bash 复制代码
# 先切换到项目根目录
cd frontend
npm install
npm run dev

启动成功之后打开:http://localhost:5173/

在正式使用前需配置大语言模型的请求地址、API Key等信息。

根据界面中的字段,选择文本生成模型提供商、图片生成模型提供商、文本模型、图片生成模型、视频语言、声音、故事主题、故事段落,然后点击生成,即可生成视频。

根据填写的段落数量,生成图片,一个段落生成一张图片,设置的段落越多,生成视频的耗时也会更久。

写在最后

Story-Flicks 可让 AI 一键生成完整的故事视频,彻底简化短视频创作过程!

无论是儿童故事、知识科普、品牌推广,还是短视频制作,它都能快速、智能、高质量地完成!

还能一键 Docker 部署,快速上手。

GitHub 项目地址:github.com/alecm20/sto...

相关推荐
70asunflower5 小时前
从CPU市场到AI算力格局:一场关于技术路线、商业逻辑与生态锁定的深度梳理
人工智能
地球资源数据云5 小时前
中国陆地生态系统主要植物功能特征空间分布数据
大数据·数据库·人工智能·机器学习
菩提小狗5 小时前
每日极客日报 · 2026年05月03日
ai·开源·极客日报·it热点·技术资讯
AI创界者5 小时前
最新RedMix-Ernie-Image整合包,解压即用:文生图、图生图,n卡8G显存玩转4K
人工智能
月诸清酒5 小时前
51-260503 AI 科技日报 (ChatGPT图像功能用户量暴涨,新用户占六成)
人工智能·chatgpt
Raink老师5 小时前
【AI面试临阵磨枪-32】如何提升工具调用(Function Call)准确率?常见失败场景与解决方法
人工智能·ai 面试
格林威5 小时前
线阵工业相机:线阵图像出现“波浪纹”,是机械振动还是编码器问题?
开发语言·人工智能·数码相机·计算机视觉·视觉检测·工业相机·线阵相机
knight_9___5 小时前
LLM工具调用面试篇5
人工智能·python·深度学习·面试·职场和发展·llm·agent
weixin_514253185 小时前
430-github-aguvis tmux
github
网络工程小王5 小时前
【LangChain Output Parser 输出解析器】输出篇
人工智能·学习·langchain