【教学类-160-05】20260412 AI视频培训-练习5“豆包AI视频《幼儿园之父:福禄贝尔(英声中字)》+豆包图片风格:伦勃朗(古典油画)竖版”

20260412万相AI视频6《福禄贝尔》风格:伦勃朗

背景需求

尝试伦勃朗黑白明暗人像,看看是否豆包能生成

10秒旁白,豆包就给了10个字,感觉太少了,

查询后是30-40字

图片生成:伦勃朗

选有技法的关键词

一个镜头生成2张

每一套关键词,选择并下载一张图片,

我想做首尾帧动图,不过先测试豆包能否做出伦勃朗人像

只有一个模型

不能生成油画人物,只能通义万相慢慢生成

只能通义万相做首尾帧视频,3*5=15小时

全部生成完成,做GIF

放慢后,音频不够,选一段

选了1分钟的音频

制作旁白

感觉中文的旁白有点短,没有凑满10秒

换成英文的旁白

中文字幕对应英文音频轨道,一一对应

手动把段落文字的空格变成换行的点

并没有多段,实际生成9段

所以人工对位,把中文字幕与英文音频波段对位

保存导出

20260412万相AI视频6《福禄贝尔》风格:伦勃朗

感悟:

1、油画人物也不能豆包生成AI视频,通义万相确定是3小时1段5秒。

2、Python调用# 播音员音色VOICE = "zh-CN-YunyangNeural" # 男播音,生成英文旁白

3、剪映字幕,需要人工分段,所以AI视频不能超过2分钟。

相关推荐
m晴朗2 小时前
ffmpeg(2)-音频相关知识
ffmpeg·音视频
sp_fyf_20242 小时前
【大语言模型】 AVGen-Bench:一个用于文本到音频-视频生成的多粒度、任务驱动型评估基准
人工智能·深度学习·神经网络·机器学习·语言模型·数据挖掘·音视频
山栀shanzhi3 小时前
【FFmpeg实战】手撕音频转码:WAV转AAC的全链路解析与C++实现
ffmpeg·音视频·aac
lq12332103 小时前
视频AI超分辨率转换器Topaz Video Pro 1.3.1
音视频
EasyDSS14 小时前
智能会议管理系统/私有化视频会议平台EasyDSS私有化部署构建企业级私域视频全场景解决方案
人工智能·音视频
潜创微科技17 小时前
切换器芯片主要型号有哪些:潜创微高清音视频领域主流型号与应用场景全解析
音视频
KevinCyao18 小时前
106视频短信接口怎么发?支持高清影音下发的106视频短信服务商
音视频
潜创微科技--高清音视频芯片方案开发19 小时前
2026年切换器方案服务商市场格局分析与主流品牌选型指南
音视频·硬件工程
潜创微科技--高清音视频芯片方案开发19 小时前
2026年高清音视频切换器方案选型分
音视频