借助各大模型的优点生成原创视频(真人人声)Plus

【技术背景】

众所周知,组成视频的3大元素,即文本+语音+图片。接着小编逐一介绍生成原创视频的过程。

【文本生成】

天工AI搜索(thttp://iangong.cn)

直接手机短信验证就可以使用,该大模型已经接入互联网,注意下图提问方式。注意,细心的筒子已经发现,该回答可能已经包含了我乎的优质答案。

ChatGPT( http://intumu.com )

天工给搜索整理出来的文案逻辑性可能存在一定的问题,尤其是几个答案的组合,就需要重新润色、梳理;经过测试,ChatGPT3.5以上在润色文档的表现要比文心一言好一些。

prompt:"文案****,请对上述文案进行润色。"

文心一言( http://yiyan.baidu.com**)**

上述文本获取之后,便可以直接转换为音频,但是为了在小红书平台取得更好的效果,就需要对其进行提炼。

prompt:"文案****,请用小红书文案格式进行概括。"

【语音生成】

讯飞星火( http://xinghuo.xfyun.cn/desk**)**

真人人声训练,可以避免千篇一律的机器人声音,这个时候需要借助工具,将你自己的声音导出。

真人人声训练,在星火PC界面右上角有三道横杠,需要录制自己的声音,远程进行训练,训练完成后就可以用自己的声音朗读文案。

使用该工具可以在软件目录result生成对应文案你的真人人声MP3

【视频素材】

(1)视频素材可以使用**必剪工具,图文成片,必剪可以根据文案生成对应的素材,字幕,背景音乐等。**这个时候,我们需要删除字幕、背景音乐,只保留视频素材。

(2)视频素材还可以使用换脸工具,对其他场景视频进行换脸操作。

这个工具当前最大的缺点就是使用CPU太慢,人脸处于正面时效果尚可。当然,你有GPU或者其他更好的工具,也可以忽略这一步。

【视频生成】

加载【语音生成】生成的真人人声MP3 ,以及【视频素材】生成的换脸后 的视频素材MP4 ,再旧借助必剪工具的智能字幕根据真人人身匹配文案,这个时候可能出现原有视频素材MP4长度大于或短于真人人声,则需要进行修订(修剪或复制)。

最后,换上自己喜欢的背景音乐,加上封面,Over。

【电气工程】专业发展方向与建议4 播放 · 0 赞同视频​编辑​

civilpy:【真人语音】讯飞星火个人声音训练及导出下载工具V0.2.exe0 赞同 · 0 评论文章​编辑

civilpy:AI人脸替换工具离线版v2.00 赞同 · 0 评论文章​编辑

civilpy:如何借助各个大模型的优点生成原创视频(真人人声)0 赞同 · 1 评论文章​编辑

相关推荐
美狐美颜sdk2 小时前
跨平台直播美颜SDK集成实录:Android/iOS如何适配贴纸功能
android·人工智能·ios·架构·音视频·美颜sdk·第三方美颜sdk
DeepSeek-大模型系统教程3 小时前
推荐 7 个本周 yyds 的 GitHub 项目。
人工智能·ai·语言模型·大模型·github·ai大模型·大模型学习
郭庆汝3 小时前
pytorch、torchvision与python版本对应关系
人工智能·pytorch·python
小雷FansUnion5 小时前
深入理解MCP架构:智能服务编排、上下文管理与动态路由实战
人工智能·架构·大模型·mcp
资讯分享周5 小时前
扣子空间PPT生产力升级:AI智能生成与多模态创作新时代
人工智能·powerpoint
melonbo6 小时前
使用FFmpeg将H.264码流封装为MP4
ffmpeg·音视频·h.264
叶子爱分享6 小时前
计算机视觉与图像处理的关系
图像处理·人工智能·计算机视觉
鱼摆摆拜拜6 小时前
第 3 章:神经网络如何学习
人工智能·神经网络·学习
一只鹿鹿鹿6 小时前
信息化项目验收,软件工程评审和检查表单
大数据·人工智能·后端·智慧城市·软件工程
张较瘦_6 小时前
[论文阅读] 人工智能 | 深度学习系统崩溃恢复新方案:DaiFu框架的原位修复技术
论文阅读·人工智能·深度学习