借助各大模型的优点生成原创视频(真人人声)Plus

【技术背景】

众所周知,组成视频的3大元素,即文本+语音+图片。接着小编逐一介绍生成原创视频的过程。

【文本生成】

天工AI搜索(thttp://iangong.cn)

直接手机短信验证就可以使用,该大模型已经接入互联网,注意下图提问方式。注意,细心的筒子已经发现,该回答可能已经包含了我乎的优质答案。

ChatGPT( http://intumu.com )

天工给搜索整理出来的文案逻辑性可能存在一定的问题,尤其是几个答案的组合,就需要重新润色、梳理;经过测试,ChatGPT3.5以上在润色文档的表现要比文心一言好一些。

prompt:"文案****,请对上述文案进行润色。"

文心一言( http://yiyan.baidu.com**)**

上述文本获取之后,便可以直接转换为音频,但是为了在小红书平台取得更好的效果,就需要对其进行提炼。

prompt:"文案****,请用小红书文案格式进行概括。"

【语音生成】

讯飞星火( http://xinghuo.xfyun.cn/desk**)**

真人人声训练,可以避免千篇一律的机器人声音,这个时候需要借助工具,将你自己的声音导出。

真人人声训练,在星火PC界面右上角有三道横杠,需要录制自己的声音,远程进行训练,训练完成后就可以用自己的声音朗读文案。

使用该工具可以在软件目录result生成对应文案你的真人人声MP3

【视频素材】

(1)视频素材可以使用**必剪工具,图文成片,必剪可以根据文案生成对应的素材,字幕,背景音乐等。**这个时候,我们需要删除字幕、背景音乐,只保留视频素材。

(2)视频素材还可以使用换脸工具,对其他场景视频进行换脸操作。

这个工具当前最大的缺点就是使用CPU太慢,人脸处于正面时效果尚可。当然,你有GPU或者其他更好的工具,也可以忽略这一步。

【视频生成】

加载【语音生成】生成的真人人声MP3 ,以及【视频素材】生成的换脸后 的视频素材MP4 ,再旧借助必剪工具的智能字幕根据真人人身匹配文案,这个时候可能出现原有视频素材MP4长度大于或短于真人人声,则需要进行修订(修剪或复制)。

最后,换上自己喜欢的背景音乐,加上封面,Over。

【电气工程】专业发展方向与建议4 播放 · 0 赞同视频​编辑​

civilpy:【真人语音】讯飞星火个人声音训练及导出下载工具V0.2.exe0 赞同 · 0 评论文章​编辑

civilpy:AI人脸替换工具离线版v2.00 赞同 · 0 评论文章​编辑

civilpy:如何借助各个大模型的优点生成原创视频(真人人声)0 赞同 · 1 评论文章​编辑

相关推荐
爱写代码的小朋友2 小时前
人工智能驱动下个性化学习路径的构建与实践研究——以K12数学学科为例
人工智能·学习
宝贝儿好4 小时前
【强化学习实战】第十一章:Gymnasium库的介绍和使用(1)、出租车游戏代码详解(Sarsa & Q learning)
人工智能·python·深度学习·算法·游戏·机器学习
绝世这天下6 小时前
【在 DGX Spark 上运行 vLLM-Omni 用于 Qwen3-TTS(语音设计,语音克隆)】
人工智能
陈大鱼头7 小时前
[译]费尽心思来保障 OpenClaw ?那跟直接用 GPT 有什么区别?
人工智能
Fleshy数模7 小时前
玩转OpenCV:视频椒盐噪声处理与图像形态学操作实战
人工智能·opencv·音视频
八月的雨季 最後的冰吻7 小时前
FFmepg-- 38-Jitter Buffer固定值c程序分析
服务器·音视频
幂律智能7 小时前
Agent × 流程引擎融合架构:从静态流程到智能流程编排
人工智能·架构·agent
无垠的广袤7 小时前
ChatECNU 大语言模型与 PicoClaw 部署
人工智能·语言模型·自然语言处理·嵌入式·树莓派
爱淋雨的男人7 小时前
自动驾驶感知相关算法
人工智能·算法·自动驾驶
互联网科技看点7 小时前
AI算力爆发叠加数据资产风口,铂拉锐科技布局去中心化数字生态
人工智能·科技·去中心化