借助各大模型的优点生成原创视频(真人人声)Plus

【技术背景】

众所周知,组成视频的3大元素,即文本+语音+图片。接着小编逐一介绍生成原创视频的过程。

【文本生成】

天工AI搜索(thttp://iangong.cn)

直接手机短信验证就可以使用,该大模型已经接入互联网,注意下图提问方式。注意,细心的筒子已经发现,该回答可能已经包含了我乎的优质答案。

ChatGPT( http://intumu.com )

天工给搜索整理出来的文案逻辑性可能存在一定的问题,尤其是几个答案的组合,就需要重新润色、梳理;经过测试,ChatGPT3.5以上在润色文档的表现要比文心一言好一些。

prompt:"文案****,请对上述文案进行润色。"

文心一言( http://yiyan.baidu.com**)**

上述文本获取之后,便可以直接转换为音频,但是为了在小红书平台取得更好的效果,就需要对其进行提炼。

prompt:"文案****,请用小红书文案格式进行概括。"

【语音生成】

讯飞星火( http://xinghuo.xfyun.cn/desk**)**

真人人声训练,可以避免千篇一律的机器人声音,这个时候需要借助工具,将你自己的声音导出。

真人人声训练,在星火PC界面右上角有三道横杠,需要录制自己的声音,远程进行训练,训练完成后就可以用自己的声音朗读文案。

使用该工具可以在软件目录result生成对应文案你的真人人声MP3

【视频素材】

(1)视频素材可以使用**必剪工具,图文成片,必剪可以根据文案生成对应的素材,字幕,背景音乐等。**这个时候,我们需要删除字幕、背景音乐,只保留视频素材。

(2)视频素材还可以使用换脸工具,对其他场景视频进行换脸操作。

这个工具当前最大的缺点就是使用CPU太慢,人脸处于正面时效果尚可。当然,你有GPU或者其他更好的工具,也可以忽略这一步。

【视频生成】

加载【语音生成】生成的真人人声MP3 ,以及【视频素材】生成的换脸后 的视频素材MP4 ,再旧借助必剪工具的智能字幕根据真人人身匹配文案,这个时候可能出现原有视频素材MP4长度大于或短于真人人声,则需要进行修订(修剪或复制)。

最后,换上自己喜欢的背景音乐,加上封面,Over。

【电气工程】专业发展方向与建议4 播放 · 0 赞同视频​编辑​

civilpy:【真人语音】讯飞星火个人声音训练及导出下载工具V0.2.exe0 赞同 · 0 评论文章​编辑

civilpy:AI人脸替换工具离线版v2.00 赞同 · 0 评论文章​编辑

civilpy:如何借助各个大模型的优点生成原创视频(真人人声)0 赞同 · 1 评论文章​编辑

相关推荐
CM莫问3 小时前
<论文>(微软)避免推荐域外物品:基于LLM的受限生成式推荐
人工智能·算法·大模型·推荐算法·受限生成
康谋自动驾驶4 小时前
康谋分享 | 自动驾驶仿真进入“标准时代”:aiSim全面对接ASAM OpenX
人工智能·科技·算法·机器学习·自动驾驶·汽车
深蓝学院5 小时前
密西根大学新作——LightEMMA:自动驾驶中轻量级端到端多模态模型
人工智能·机器学习·自动驾驶
归去_来兮5 小时前
人工神经网络(ANN)模型
人工智能·机器学习·人工神经网络
2201_754918415 小时前
深入理解卷积神经网络:从基础原理到实战应用
人工智能·神经网络·cnn
强盛小灵通专卖员5 小时前
DL00219-基于深度学习的水稻病害检测系统含源码
人工智能·深度学习·水稻病害
Luke Ewin6 小时前
CentOS7.9部署FunASR实时语音识别接口 | 部署商用级别实时语音识别接口FunASR
人工智能·语音识别·实时语音识别·商用级别实时语音识别
Joern-Lee6 小时前
初探机器学习与深度学习
人工智能·深度学习·机器学习
云卓SKYDROID6 小时前
无人机数据处理与特征提取技术分析!
人工智能·科技·无人机·科普·云卓科技
R²AIN SUITE6 小时前
金融合规革命:R²AIN SUITE 如何重塑银行业务智能
大数据·人工智能