(这是一个关于自媒体视频制作的系列文章,作者本人也处于摸索期,分享的目的在于交流视频制作经验、好用的工具。)
刷短视频时,常常会遇到一类 AI 辅助创作的视频(如心理辅助、文字学习、寓言故事、故事讲解、电影讲解等),视频作者可以发布一期一期不同的内容,但讲解人音色总是可以保持不变。时间久了,你听到这个声音,就知道是这个作者创作的了。
其实,这种 AI 辅助生成解说词的工具就是 TTS(Text to Speech) 工具,中文叫做文本转语音工具。
这类工具早在 AI 出来之前就有,近几年在 AI 加持下,TTS 工具更加强大了。一些做得好的 TTS 模型,生成的语音根本分辨不出来是否是真人。有些 TTS 工具,甚至提供音色克隆功能,你可以导入你喜欢的声音,制作一个你喜欢的音色,作为你的专属视频解说员。
想要尝试一下么?
直接上 Google、Bing 上搜索 TTS 关键词,你可以看到一堆推荐产品,比如大名鼎鼎的 ElevenLabs(但是该产品对中文支持不太好),并且很多产品提供了免费试用功能,你可以先听听效果。
(Bing 上的 TTS 搜索结果)
这里想给大家推荐的是 AIVocal,地址在这里:aivocal.io/ai-voice ,你也可以直接搜索 AIVocal 关键词。
(Bing 上的 AIvocal 搜索结果)
AIVocal 的 TTS 工具支持 600+ 音色,24+ 语言支持(划重点,对中文特别友好),对付费用户提供商业授权支持。如果它提供的音色你不满意,你还可以克隆自己的音色(当然前提是你不能侵权,不能做违法乱纪的事)。
(AIVocal 的 TTS 操作界面)
回到文章的主题:如何拥有音色逼真、效果一致,特别具有辨识度的短视频配音?
在 AIVocal 上这件事非常简单,你只需要选定一个音色,收藏好这个音色就可以了。
需要制作配音的时候,你只需要调整你的文字内容即可。
甚至,你选定了音色后,无论是中文、英语,还是韩文、日语、阿拉伯语、印度语,AIVocal 都能保持稳定的发挥,正确按照语言朗读的情况下,还能保持音色一致,你一下就可以认出是同一个人说出的话。
PS: 你会去克隆自己的音色,然后使用 24+ 语言跟你的对象说一段情话,然后震惊 ta 一百年么?这在 AIVocal 上也很简单,你甚至都不用花钱就可以做到,试试 AIVocal 的音色克隆功能即可 aivocal.io/ai-voice/cl... 。