技术栈
数字人
编程迪
2 天前
小程序
·
数字人
·
去水印
·
短视频文案提取
·
文案改写创作
开源数字人系统源码短视频文案提取文案改写去水印小程序
短视频去水印:文案提取与改写:数字人系统应用:综合应用:软件订阅费单次使用费广告收入增值服务企业合作与定制
AIGC安琪
2 天前
人工智能
·
stable diffusion
·
数字人
·
sd
·
sd教程
只需3步,使用Stable Diffusion无限生成AI数字人视频
先看效果,感兴趣的可以继续读下去。没有找到可以上传视频的地方,大家打开这个链接可以看到:www.aliyundrive.com/s/CRBm5NL3x…
算家云
22 天前
人工智能
·
大模型
·
aigc
·
音视频
·
数字人
·
智能对话
·
动态图像
重塑视频新语言,让每一帧都焕发新生——Video-Retalking,开启数字人沉浸式交流新纪元!
Video-Retalking 模型是一种基于深度学习的视频再谈话技术,它通过分析视频中的音频和图像信息,实现视频角色口型、表情乃至肢体动作的精准控制与合成。这一技术的实现依赖于强大的技术架构和核心算法,特别是生成对抗网络(GAN)等先进算法的应用。
PLUS_WAVE
22 天前
学习
·
计算机视觉
·
数字人
·
三维重建
·
3d gaussian
·
3dgs
·
headavatar
GAGAvatar: Generalizable and Animatable Gaussian Head Avatar 学习笔记
GAGAvatar(Generalizable and Animatable Gaussian Avatar),一种面向单张图片驱动的可动画化头部头像重建的方法,解决了现有方法在渲染效率和泛化能力上的局限。 旋转参数
云樱梦海
25 天前
音视频
·
数字人
·
echomimicv2
阿里发布 EchoMimicV2 :从数字脸扩展到数字人 可以通过图片+音频生成半身动画视频
EchoMimicV2 是由阿里蚂蚁集团推出的开源数字人项目,旨在生成高质量的数字人半身动画视频。以下是该项目的简介:
机器学习是魔鬼
1 个月前
数字人
·
图片处理
·
视频处理
·
魔改
·
hellomeme
HelloMeme 上手即用教程
HelloMeme是一个集成空间编织注意力的扩散模型,用于生成高保真图像和视频。它提供了一个代码库,包含实验代码和预训练模型,支持PyTorch和FFmpeg。用户可以通过简单的命令行操作来生成图像和视频。
Slientsakke
2 个月前
计算机视觉
·
aigc
·
数字人
·
视频生成
·
超分辨率
Hallo2 长视频和高分辨率的音频驱动的肖像图像动画 (数字人技术)
HALLO2: LONG-DURATION AND HIGH-RESOLUTION AUDIO-DRIVEN PORTRAIT IMAGE ANIMATION
算家云
2 个月前
人工智能
·
深度学习
·
3d
·
数字人
·
说话头
·
智能修复
·
面部同步
synctalk模型部署教程
在合成逼真的语音驱动的说话头视频时,实现高度同步是一项重大挑战。传统的生成对抗网络 (GAN) 难以保持一致的面部身份,而神经辐射场 (NeRF) 方法虽然可以解决这个问题,但通常会产生不匹配的唇部运动、不充分的面部表情和不稳定的头部姿势。栩栩如生的说话头需要同步协调主体身份、唇部运动、面部表情和头部姿势。缺乏这些同步是一个根本缺陷,导致不切实际和人为的结果。
龚子亦
3 个月前
unity
·
数字人
·
vroidstudio
·
vrm
解决VRM格式模型在Unity中运行出现头发乱飞等问题
通过VRoidStudio制作导出的vrm格式的模型,放在unity中使用时,一运行就会出现头发乱飞,没有自然下垂的问题
龚子亦
3 个月前
人工智能
·
unity
·
数字人
·
虚拟现实
·
blendshape
·
嘴型驱动
·
vroidstudio
为VRoidStudio制作的vrm格式模型制作blendshape
bs视频演示下载网址:https://vroid.com/en/studio下载网址:https://github.com/vrm-c/UniVRM/releases 注意:unity版本要在2021.3 LTS及以上,VRM1.0和VRM0.x,要下载对应的插件
网安-搬运工
4 个月前
人工智能
·
自然语言处理
·
llm
·
大语言模型
·
数字人
·
ai大模型
·
rag
揭秘AI数字人:RAG技术如何重塑数字人交互新纪元(一)
大家好,今天我想与大家分享一个我非常热衷的话题——数字人。作为一名深度参与数字人项目的从业者,我有幸见证了这一领域的快速发展和无限潜力。
知来者逆
4 个月前
人工智能
·
深度学习
·
数字人
·
虚拟现实
·
虚拟人
·
3d数字人
AVI-Talking——能通过语音生成很自然的 3D 说话面孔
论文地址:https://arxiv.org/pdf/2402.16124v1.pdf逼真的人脸三维动画在娱乐业中至关重要,包括数字人物动画、电影视觉配音和虚拟化身的创建。以往的研究曾试图建立动态头部姿势与音频节奏之间的关联模型,或使用情感标签或视频剪辑作为风格参考,但这些方法的表现力有限,无法捕捉到情感的细微差别。它们还要求用户手动选择风格源,这往往会导致应用不自然。
RoronoaV587
4 个月前
人工智能
·
数字人
·
live2d
·
文本转语音
live2d + edge-tts 优雅的实现数字人讲话 ~
之前有想做数字人相关项目,查了一些方案。看了一些三方大厂的商用方案,口型有点尴尬,而且很多是采用视频流的方案,对流量的消耗很大。后来了解了live2d 技术,常在博客网页上见到的看板娘就是live2d技术实现的 ~
春末的南方城市
5 个月前
人工智能
·
计算机视觉
·
aigc
·
音视频
·
数字人
ECCV2024,清华&百度提出ReSyncer:可实现音频同步嘴唇动作视频生成。
清华&百度等联合提出了ReSyncer,可以实现更高稳定性和质量的口型同步,而且还支持创建虚拟表演者所必需的各种有趣属性,包括快速个性化微调、视频驱动的口型同步、说话风格的转换,甚至换脸。
喜好儿aigc
6 个月前
microsoft
·
微软
·
数字人
·
文本转语音
·
gpt-4o
微软推出集成GPT-4o的文本转语音虚拟数字人服务
微软近日宣布,其全新的文本转语音虚拟数字人服务正式上线,并集成了GPT-4o技术。这一服务为用户提供了创建实时互动数字人的可能。通过先进的自然语言处理技术,数字人能够将文本转化为自然流畅的语音,并配以生动的虚拟形象,实现与用户的实时互动。
JackieZhengChina
6 个月前
人工智能
·
数字人
·
白皮书
快速了解《大模型赋能下的AI2.0数字人平台》白皮书
在生成式AI和大模型的赋能下,数字人迎来AI 2.0时代。它能否成为每个人的“数字分身”,转化为新型的AI劳动力工具?商汤科技与上海市人工智能技术协会、零壹智库、增强现实核心技术产业联盟联合发布《大模型赋能下的AI 2.0数字人平台》。《白皮书》不仅总结了生成式AI和大模型对数字人的推动作用,还提出业界首个“AI 2.0数字人平台评估体系”,为AI 2.0时代数字人行业发展提供参考。
cha111
6 个月前
人工智能
·
数字人
·
ai大模型
·
ai复活
AI复活亲人市场分析:技术、成本与伦理挑战
“起死回生”这种事,过去只存在于科幻电影里,但今年,被“复活”的案例却越来越多。2月底,知名音乐人包晓柏利用AI“复活”了她的女儿,让她在妈妈生日时唱了一首生日歌;3月初,商汤科技的年会上,刚刚去世不久的创始人汤晓鸥以数字人的形式被“复活”,并进行了风格独特的演讲;近日,有网友用AI技术“复活”了李玟、乔任梁等已逝明星,掀起了巨大的争议。
老艾的AI世界
6 个月前
人工智能
·
深度学习
·
ai
·
数字人
·
ai数字人
川普真会说中文?连嘴型都同步,VideoReTalking AI数字人下载介绍
你能想到这种画面吗?霉霉在节目中用普通话接受采访,特朗普在老家用中文脱口秀,蔡明老师操着一口流利的英文调侃潘长江老师..
MonkeyKing_sunyuhua
6 个月前
python
·
数字人
搭建musetalk数字人的步骤
(建议使用 python 版本 >=3.10 和 cuda 版本 =11.7。)注意:这一步可能提示错误,跳过即可
此人姓于名叫罩百灵
7 个月前
论文阅读
·
人工智能
·
aigc
·
数字人
论文笔记:Image Anaimation经典论文-运动关键点模型(Monkey-Net)
Monkey-Net(MOviNg KEYpoints) paper: https://arxiv.org/pdf/1812.08861, CVPR 2019 code: https://github.com/AliaksandrSiarohin/monkey-net/tree/master