豆包改写、ai配音,用剪映10分钟翻译一条解说视频:实现字幕、画面、语音三者对齐实操教程

结合剪映、豆包、谷哥剪映助手、AI配音等,快速完成视频翻译,并实现字幕、画面、语音的精准对齐。以下是详细的步骤拆解,以中文视频转译成英文视频为演示例子:

一、建新草稿并把原始视频导入,如果你的原始视频需要去除中文字幕的,可以使用开源的vsr工具智能去除,但这个vsr是需要有英伟达显卡才能用。

二、使用剪映识别字幕,然后把原视频中的原声字幕删除,如果有一两个字的单独字幕,也可以考虑合并到上下字幕中去,避免后续翻译时出现无意义翻译字段,完成这些工作后把字幕导出为txt格式。

三、修改字幕文本,或者说伪原创字幕文本,这样做的目的就是达到一定的原创度,但是要求不能改变字幕文本的行数,比如原来你的字幕数是73行,那修改后的字幕数,也只能是73行。这个需求我使用豆包来实现,豆包对应的提示词为"帮我伪原创一下下面这段文字,要求逐行进行修改,结果保持原来的行数,直接输出,不要打开编辑器:"。

四、把中文字幕文本翻译成英文,与修改字幕文本一样,不能改变字幕的行数,这个需求我也使用豆包来完成。如果你有用得更顺手的ai,也可以使用,核心点就是保持字幕行数不变就行。

豆包对应的提示词为"你作为一名资深的翻译员,帮我把下面这段文字翻译成英文。要求将文章中的表达方式和句子结构调整为符合美国人的语言风格。确保使用美国人易于理解的词汇和习语,并使用适当的语言和表达方式来达到所需的翻译效果。避免官方语言,说人话,不要文绉绉的语言,而是尽可能用更自然的美语俚语方式表达相同的意思。最重要的是,严格保持行数不变,也就是以行作为翻译的单位,避免出现翻译后行数与原来不一致的情况,因为我要用翻译后的文案与原有字幕进行匹配,因此行数一定要保持一致:"

五、得到翻译后的英文字幕后,对英文字幕进行配音。对于配音软件,可以根据自己的实际喜好来配音,但要求就是,每一个语句之间的停顿时长,最理想是2秒,如果达不到,也要保证在0.7秒以上,如果实在不行,就把对应的配音语速变慢,以达到语句之间的停顿时长尽量长的目的,因为后续分割音频语句之间的依据就是这个静音时长区间。我演示使用的配音工具是海螺ai下面的文本转语音功能。

六、对音频进行分割,这是非常关键的步骤,配音音频生成后,导入剪映,这个时候你可以放大剪映草稿中的时间线的缩放比例,看看音频语句间的停顿时长是多少,然后记住,比如我的演示的是0.7秒。

接着打开谷哥剪映助手,定位到左侧"对齐类"中的"对齐大师Pro",选择第二个功能"分割音频",选中当前需要处理的剪映草稿,在右侧的选项中,按照选项提示,一步步操作,关键设置点是下面这个时长停顿设置,要与你音频的实际时长一致才能成功分割。设置完成后,选中对应的剪映草稿即可执行分割。

七、借助谷哥剪映助手完成实现字幕、画面、语音三者对齐,定位到谷哥剪映助手的"对齐大师Pro"中的第三个功能"语音画面字幕共同对齐",在右侧的设置选项中,根据自己的情况设置或者保持默认,我演示中的英文语速比较慢,因为我把语速稍微调整快速一点为1.1倍,这都是可以自行选择的,不影响最终的对齐效果。

谷哥剪映助手下载地址:

链接: pan.quark.cn/s/a970ed43136b

相关推荐
信也科技布道师1 天前
互动视频技术在销售AI培训中的最佳实践
人工智能·ai·视频
zymill3 天前
flvAnalyser --- AVS系列视频标准ES分析使用指南
音视频·实时音视频·视频编解码·视频·智能电视·avs3
草明4 天前
一个将本地视频/音频转换为文字或字幕文件的命令行工具
音频·视频·文本
jbk33115 天前
维多视频批量工具实现视频随机变速、批量视频镜头抽帧图片、文件批量智能管理等功能教程
自动化·视频·剪辑软件
独自归家的兔5 天前
通义万相-文生视频 Text2Video
人工智能·视频
咕噜船长8 天前
使用Qwen3-VL模型批量标注视频内容(视频理解)
人工智能·pytorch·深度学习·音视频·视频
360智汇云12 天前
智能体对话全面进化:多模态融合重塑交互体验
视频
core51223 天前
[硬核解析] 从感知到交互:InternVideo 1/2/2.5 全系列架构演进与原理解析
架构·大模型·交互·视频·video·intern
视频技术分享23 天前
实时音视频技术选型指南:国内主流厂商功能对比
视频