Qwen3-Coder 实战!历史人物短视频一键生成,多分镜人物不崩,魔搭直接玩

1.前言

Qwen3-Coder 是由阿里巴巴通义千问团队开发的一款开源代码生成和智能编程模型,专注于代码生成、代理编程和多语言支持。该模型是 Qwen 系列模型中最新和最强大的版本之一,具有卓越的代码生成和代理能力。

之前一个有给大家介绍过使用Qwen3-Coder模型实现AI应用功能。目前在开源项目中Qwen3-Coder编码能力这块还是不错的,我写文章用豆包,写代码就用qwen3-coder模型。之前有一个开源的项目叫做《AI 一键搞定!中医药科普短视频制作全流程》我昨天也刚好把这个项目升级了,目前这个项目已经部署在魔搭社区了,感兴趣的小伙伴可以去体验看看

www.modelscope.cn/studios/zho...

今天就带大家使用国产Qwen3-Coder模型 使用CCR开发工具在 中药的这个项目基础上扩展和改造成一个新项目。话不多说,下面带大家开干。

2项目开发过程

本项目我们使用的是Qwen3-Coder模型。魔搭社区目前提供每天2000次调用。

另外Qwen CLI 也提供每天2000次调用。

Qwen CLI 是一个基于 Qwen 模型的命令行工具,专为代码生成、代码理解、代码编辑等任务设计。它支持 Node.js、OpenAI SDK 等集成,提供免费版本和文档支持.

参考文献aiengineerguide.com/blog/qwen-c...

​ 我这里使用CCR 代理工具来使用,关于CCR 工具的使用。不了解的小伙伴可以看我之前的文章《免费玩转 AI 编程!Claude Code Router + Qwen3-Code 实战教程

​ 下面给大家介绍一下开发过程。

ccr ui 设置模型

启动 ccr code

提示词生成

arduino 复制代码
这个代码里面关于历史人物的提示词主要是介绍了历史人物的,请根据代码的主要逻辑编写一个基于使用LangGPT提示词(prompt)语法编写一个历史人物故事分镜提示词专家。
  主要是用户输入一个简单的历史人物,该提示词可以生成 5-6段关于这个历史人物的故事。故事需要连贯性,符合短视频制作要求。
  请根据上面要求生成一个LangGPT提示词语法的历史人物故事分镜提示词专家,输入"历史人物故事分镜提示词专家.md"文档

生成提示词

接下来

请基于上面的生成的提示词更新一下代码中historical_figures_mcp_server_modelscope_jimeng.py 提示词模版代码 PROMPT_TEMPLATES ,PROMPT_TEMPLATES 等信息,其中提示词生成需要符合 短视频制作逻辑,先生成分境提示词,在根据分镜提示词生成相应的短视频,单个视频长度不超过5秒,然后将生成 5 -6个短视频最后合成一个视频。需要先符合上面逻辑,不需要一次性生成。

下面是代码调试过程中的提示词

过程提示词

​ 提示词1

复制代码
请认真阅读app_jimeng.py、historical_figures_mcp_server_modelscope_jimeng.py、历史人物故事分镜提示词专家.md

我希望做一个多分镜关于历史人物的短视频,大概生成 5-6 分境头。请参考一下app_multiple.py 、zhongyao_multiple_mcp_server.py

这个项目是实现了一个中药的多分境。现在我需要你只是参考它,基于我原来项目代码实现关于历史人物的短视频功能。

提示词2

arduino 复制代码
请参考app_jimeng.py 代码里面的系统参数设置,我需要用这些参数配置。另外config.ini 配置文件代码里面没有,需要更换config_modelscope_jimeng.ini,请一并修改app_historical_figures_multiple.py和historical_figures_multiple_mcp_server.py 代码,保持代码修改一致性

提示词3

复制代码
app_historical_figures_multiple.py 代码里面系统参数缺少批量生成文本内容提示词功能,请增加。这个主要的目的是方便我在生成人物分镜故事内容,方便测试和定位问题。

提示词4

复制代码
通义万相AI生视频---使用指南.md 是一个文生视频提示词指南。目前这个代码historical_figures_multiple_mcp_server.py 中关于文生视频提示词 get_historical_figure_video 函数中的代码提示词过于简单的,请参考通义万相AI生视频---使用指南.md 生成一个符合文生视频的提示词。这里需要考虑多分镜头下需要保持人物和画面的一致性。请结合前面get_historical_figure_info 方法提示词结合起来修改。

请基于以上内容修改代码。

题材5

复制代码
通义万相AI作画---使用指南.md是一个是一个文生图提示词指南 目前这个代码historical_figures_multiple_mcp_server.py 中关于文生图提示词get_historical_figure_image 函数中的代码提示词过于简单的,请参考 通义万相AI作画---使用指南.md 生成一个符合文生图的提示词。这里需要考虑多分镜头下需要保持人物和画面的一致性。请结合前面get_historical_figure_info 方法提示词结合起来修改。

请基于以上内容修改代码。

题材6

复制代码
historical_figures_multiple_mcp_server.py  代码中关于文生图的提示词人物和风格一致性保持的不错,请根据这个文生图的提示词修改一下 文生视频这块的提示词,之前测试的时候发现文生视频的人物风格一致性保持的不行,多个分镜 人物会发生变化。请根据上面要求修改。

经过多次迭代代码完成。代码结构如下

2.项目运行效果

我们使用下面命令启动程序

shell 复制代码
 python3 app_historical_figures_jimeng.py

浏览器输入地址信息http://localhost:7860/

​ 功能点介绍

参数设置

这里主要是用到了一些模型配置。

语言模型我们这里用到魔搭社区提供的免费的deepseek-ai/DeepSeek-V3 模型,文生图模型和文生视频我们这里用到了最新的即梦4.0的模型。语言模型是基于我之前EdgeTTS 模型。详细配置页面可以参考下面截图

分步功能测试

这里地方主要有4个功能(文本生成、文生图、文生视频、文本生成语音),这里主要是为了方便单体测试,也是让小伙伴来了解和熟悉这个项目包含哪些功能。

获取历史人物信息

我们输入历史人物提示词信息,比如曹操。点击获取信息,系统根据要求返回曹操历史人物的相关信息。

生成历史人物图片

我们可以同样输入提示词比如曹操。点击生成图片,系统系统根据要求返回曹操历史人物的图片信息(生成4张图片),这个请求时间会稍微长点,下面是后端程序日志输出。

大概1-2分钟后我们会在前端看到页面。

生成背景视频

这个和前面的操作也是类似,输入一个历史人物提示词:我们还拿曹操为案例。 点击生成背景视频。会生成大概5秒的短视频

从文本生成语音

这个地方主要是通过文本生成一段语音播放,主要是为了用户体验和测试使用

一键生成完整视频

这个一键生成完整视频是本项目重点,用户只需要输入一段简单的提示词比如:曹操。这样时候系统会自动调用文本生成模型,文本生图模型、图生视频模型、文生生成语音模型最后把这些合成一个完整的短视频。由于生图和生成视频时间限制这里我们做了4个分境,然偶把最后生成4个分镜短视频合成一个大概有20秒短视频。生成时间大概3-5分钟(主要取决后端生成视频和合成视频所需花费时间)

生成的效果如下:

​ 生成的视频效果如下:

3.项目体验地址

目前这个项目我已经跟新到魔搭社区了。我们可以登录魔搭社区网站:modelscope.cn

点击创空间

搜索:"历史人物" 关键字 可以搜索到这个项目

打开项目后就可以看到项目了

大家也可以直接点击下面项目链接地址打开 modelscope.cn/studios/www...

具体使用这里就不给大家介绍了。上面的项目运行效果已经给大家介绍了。

4.总结

​ 今天主要带大家了解了基于 Qwen3-Coder 模型开发的历史人物故事短视频项目,包括使用 CCR 工具实现项目扩展、升级至即梦 4.0 模型保证多分镜下人物与画面的一致性、开发 5-6 个分镜短视频合成功能,以及分步测试(文本生成、文生图、文生视频、文本转语音)和一键生成完整视频的全流程实现。

历史人物故事的传播历经了从史书典籍到影视演绎的演变,而此次结合 Qwen3-Coder 模型的代码生成能力与即梦 4.0 等生成式 AI 技术,进一步打破了历史场景可视化的壁垒 ------ 让抽象的历史记载转化为连贯的分镜故事,使历史人物的形象与事迹得以更鲜活地呈现。

该项目不仅解决了此前多分镜生成中人物风格易变、视频连贯性不足的问题,更通过模型协同与功能优化,降低了历史科普短视频的创作难度,为历史知识的年轻化、趣味化传播提供了高效工具。

感兴趣的小伙伴可以登录魔搭社区体验该项目(<modelscope.cn/studios/www... 也欢迎持续关注后续代码开源及更多功能升级的详细内容。今天的分享就到这里结束了,我们下一篇文章见。

#Qwen3-Coder挑战赛#

相关推荐
神奇小汤圆22 分钟前
浅析二叉树、B树、B+树和MySQL索引底层原理
后端
文艺理科生31 分钟前
Nginx 路径映射深度解析:从本地开发到生产交付的底层哲学
前端·后端·架构
千寻girling32 分钟前
主管:”人家 Node 框架都用 Nest.js 了 , 你怎么还在用 Express ?“
前端·后端·面试
南极企鹅33 分钟前
springBoot项目有几个端口
java·spring boot·后端
Luke君6079735 分钟前
Spring Flux方法总结
后端
define952739 分钟前
高版本 MySQL 驱动的 DNS 陷阱
后端
忧郁的Mr.Li1 小时前
SpringBoot中实现多数据源配置
java·spring boot·后端
暮色妖娆丶2 小时前
SpringBoot 启动流程源码分析 ~ 它其实不复杂
spring boot·后端·spring
Coder_Boy_2 小时前
Deeplearning4j+ Spring Boot 电商用户复购预测案例中相关概念
java·人工智能·spring boot·后端·spring
Java后端的Ai之路2 小时前
【Spring全家桶】-一文弄懂Spring Cloud Gateway
java·后端·spring cloud·gateway