用 AI 一键搞定!中医药科普短视频制作升级版

1.前言

中药信息的发展历史是一个跨越数千年的演进过程,从原始社会的口耳相传,到甲骨金石的刻画,再到纸张印刷的普及,直至现代的数字化技术,每一种信息载体的革新都推动了中医药知识的积累与传播。中医药信息学作为一门新兴学科,是中医药学与信息学交叉融合的产物,其发展经历了从古代信息传递方式到现代中医药信息系统的演变。中医药信息学的学科建设始于20世纪90年代末,医学信息学教育与医学图书馆学、情报学和信息管理学专业教育密切相关。在政策支持和教育体系的推动下,中医药信息学在院校教育、继续教育和政策支持方面取得了显著进展,如2013年全国20所中医药本科院校开设了中医药信息学课程.

由于人工智能的快速发展,AI在医疗教育领域将会有更大的发展空间。下面一张关于AI在中医药信息的现代化应用。

还记得之前给大家介绍的中药科普项目吗?对这个项目不了解的小伙伴可以看我之前的文章《AI 一键搞定!中医药科普短视频制作全流程》受限于当时的技术条件,我们只能用 5 秒的短频来呈现核心内容 ------ 画面分辨率有限,无法展现炮制过程的动态变化。但就在 2025 年 7 月之后,AI 生成技术迎来爆发式突破,一系列开源模型的陆续发布彻底改变了内容创作的边界,为中药知识的可视化打开了全新可能。

7 月 28 日,阿里巴巴率先开源电影级视频生成模型通义万相 Wan2.2,首次将 "美学控制系统" 引入开源领域。这个支持 1080P 高清输出的模型,能通过多轮提示词生成连贯的短剧内容,完美解决了中药炮制过程的动态展示难题。现在只需输入 "当归酒炙:中火翻炒至表面微焦,酒香溢出",模型就能模拟出符合物理规律的翻炒动作、逐渐变化的色泽,甚至能通过光影变化呈现药材内部成分的转化过程。其 1.3B 轻量版本仅需 8GB 显存即可运行,让个人创作者也能拥有专业级视频制作能力。

9 月 5 日字节跳动发布的即梦图片 4.0,则通过多模态生图技术为中药可视化注入新活力。这个支持文生图、图像编辑与组图生成的全能模型,对中文语义有着惊人的理解精度。当输入 "川贝母横截面显微结构,淀粉粒呈类圆形" 时,它能生成堪比显微镜下的细节图像;而创作 "《本草纲目》风格的人参插画" 时,其智能画布功能可实现传统水墨风格的统一调和。最实用的是首尾帧控制功能 ------ 上传药材鲜品与炮制品的图片,模型能自动生成平滑过渡的 6 秒视频,直观展示炮制前后的性状变化。

在图像生成与编辑领域,8 月 26 日 Google DeepMind 推出的 Gemini 2.5 Flash Image(社区昵称 "Nano Banana")更是以 1362 分的 Elo 成绩登顶行业榜单。这个以精准编辑著称的模型,特别适合中药跨场景展示:先用它生成 "三七在云南文山种植基地" 的实景图,再通过提示词 "保持药材形态不变,背景改为实验室显微镜视角",就能得到一致性极强的对比图像。其强大的修复功能还能让泛黄的古籍药草图重焕新生,自动补全残缺的炮制步骤插画。

这2天我在之前开源的项目《AI 一键搞定!中医药科普短视频制作全流程》项目中修改了相关代码把原来单个文生视频(5秒)扩展到4个图生视频功能(大概有20秒时间)。有的小伙伴可以会问能不能扩展到1分钟视频呢?其实这个技术上是可行的,无非就是生成多个分镜,然后通过分镜生成对应的文生图、图生视频等。主要考虑到用户体验,目前文生视频和图生视频,单个视频生成大概都是需要1分钟左右,如果时间太长了用户会等不了体验效果差,所以本次我们只扩展到4个分镜视频。那么这样的效果是什么样子的呢?

大家可以看一下截图和视频

上次给大家介绍了项目的开发制作过程,本次就不给大家介绍开发过程了。重点本次介绍这个新功能和新特点。

2.项目新功能

新功能点1

上次版本我们是基于豆包的2025年4月推出的doubao-seedream-3-0-t2i-250415模型,该模型是一个文生图模型。

这次我们把文生图模型升级到jimeng-4.0。这个模型也是上周刚刚发布的2025年9月5日。

这个模型最大特点是可以保持人物的一致性,效果非常不错,我在上期文章给大家介绍过。不了解的小伙伴可以看我之前的文章

dify案例分享-免费玩转即梦 4.0 多图生成!Dify 工作流从搭建到使用全攻略,附案例效果》。通过它可以生成一组一致性的图片

下面是我在即梦平台上生成的中药图片

新功能点2

文生视频之前我们使用的豆包doubao-seedance-1-0-lite-t2v-250428。

由于即梦4.0可以实现文生图并且保持人物和物体的一致性,这样我们再基于生成的图片在借助即梦3.0图生视频模型就可以实现一组一致性的图生视频了。所以本次我们实现了更加复杂的图生视频功能。生成的单个视频效果如下:

这样的人物一致性保持的就非常好了。(上面我只贴了2个视频生的截图)

新功能点3

为了方便小伙伴对这个项目了解,我们增加了演示效果视频以及对这个实现的技术细节披露(两阶段流程)

这样大家访问到这个项目,就非常直观的看到项目生成视频最终效果(即使没有体验,也能通过演示视频了解到项目功能点)以及技术架构说明等相关信息。

3.项目体验

目前这个项目v.0.0.2版本图生视频多分镜版已经跟新到魔搭社区了。项目的体验地址:

www.modelscope.cn/studios/zho...

大家可以登录魔搭社区-创空间,搜索"zhongyao"检索到这个项目

​ 如果觉的项目不错,也可以帮我点个小红星。

以上就是本次新功能点。

4.项目总结和回顾

目前这个项目我中间改了好几个版本,支持豆包模型、支持阿里Qwen/Qwen-Image、硅基流动的Wan-AI/Wan2.2-T2V-A14B模型。以及他们之间的组合。为什么有多个版本?这个是因为我们处在AI 大爆发的时代,新模型不断推成出新。我也在第一时间进行修改和适配,找到一个比较好的效果。

目前来看即梦的模型不论出图效果还是文生图和文生视频、图生视频这块速度都是比较快的。阿里的通义万象Wan2.2 文生视频模型、图生视频模型效果不错,但是生成的视频速度太慢了。(硅基流动上调的接口)下面是代码的多个版本

​ 目前这快代码在魔搭上可以找到,但是全部的代码目前还没有开放出来。有小伙伴对这个项目感兴趣的话,我会在9月中下旬开源出来。大家可以持续关注我的文章,避免错过了。

5.提前预告

​ 目前基于我上面的项目可以扩展更多新的短视频制作,尤其是自媒体创造这块。项目还是有一定的商业价值的。不瞒大家说,我在这个项目上也扩展了一个新的功能,是关于历史人物故事的短视频。项目整体框架就是基于我中药的这个项目改的。效果如下:

那么这个新项目是如何开发的呢? 嘿嘿,这里我们主要用了qwen3-coder模型来实现的。

​ 后面给大家介绍如何基于中药的项目魔改成历史人物故事详细开发步骤。今天就不给大家介绍了,感谢的小伙伴可以持续关注。

6.总结

今天主要带大家了解了中医药科普短视频制作项目的升级版功能,包括升级至即梦 4.0 模型实现内容一致性生成、新增图生视频多分镜功能,以及补充演示效果与技术细节说明等。中医药信息的传播历经数千年迭代,从原始的口耳相传到现代的数字化呈现,而此次 AI 生成技术的突破(如通义万相 Wan2.2、即梦 4.0 等模型的应用),进一步打破了中医药知识可视化的边界,让复杂的炮制过程、药材性状变化等内容得以更生动直观地展现。

该升级版方案不仅解决了此前短视频时长有限、画面细节不足的问题,更通过多模型组合与功能优化,降低了专业级科普内容的创作门槛,为中医药知识的年轻化传播提供了更高效的工具。

感兴趣的小伙伴可以登录魔搭社区体验该项目,也欢迎持续关注后续代码开源及历史人物故事短视频项目的详细开发内容。今天的分享就到这里结束了,我们下一篇文章见。

相关推荐
秋难降2 小时前
零基础学习SQL(十一):SQL 索引结构|从 B+Tree 到 Hash,面试常问的 “为啥选 B+Tree” 有答案了
数据库·后端·mysql
SamDeepThinking3 小时前
用设计模式重构核心业务代码的一次实战
java·后端·设计模式
用户49055816081255 小时前
lvs会话同步
后端
用户49055816081255 小时前
linux内核网络协议栈报文的处理过程
后端
夜宵饽饽5 小时前
上下文工程实践 - 工具管理(上篇)
javascript·后端
ERP老兵_冷溪虎山5 小时前
Python/JS/Go/Java同步学习(第十三篇)四语言“字符串转码解码“对照表: 财务“小南“纸式转码术处理凭证乱码崩溃(附源码/截图/参数表/避坑指南)
java·后端·python
努力的小郑5 小时前
MySQL索引(四):深入剖析索引失效的原因与优化方案
后端·mysql·性能优化
智商偏低5 小时前
ASP.NET Core 中的简单授权
后端·asp.net