数字人

编程迪2 天前
小程序·数字人·去水印·短视频文案提取·文案改写创作
开源数字人系统源码短视频文案提取文案改写去水印小程序短视频去水印:文案提取与改写:数字人系统应用:综合应用:软件订阅费单次使用费广告收入增值服务企业合作与定制
AIGC安琪2 天前
人工智能·stable diffusion·数字人·sd·sd教程
只需3步,使用Stable Diffusion无限生成AI数字人视频先看效果,感兴趣的可以继续读下去。没有找到可以上传视频的地方,大家打开这个链接可以看到:www.aliyundrive.com/s/CRBm5NL3x…
算家云22 天前
人工智能·大模型·aigc·音视频·数字人·智能对话·动态图像
重塑视频新语言,让每一帧都焕发新生——Video-Retalking,开启数字人沉浸式交流新纪元!Video-Retalking 模型是一种基于深度学习的视频再谈话技术,它通过分析视频中的音频和图像信息,实现视频角色口型、表情乃至肢体动作的精准控制与合成。这一技术的实现依赖于强大的技术架构和核心算法,特别是生成对抗网络(GAN)等先进算法的应用。
PLUS_WAVE22 天前
学习·计算机视觉·数字人·三维重建·3d gaussian·3dgs·headavatar
GAGAvatar: Generalizable and Animatable Gaussian Head Avatar 学习笔记GAGAvatar(Generalizable and Animatable Gaussian Avatar),一种面向单张图片驱动的可动画化头部头像重建的方法,解决了现有方法在渲染效率和泛化能力上的局限。 旋转参数
云樱梦海25 天前
音视频·数字人·echomimicv2
阿里发布 EchoMimicV2 :从数字脸扩展到数字人 可以通过图片+音频生成半身动画视频EchoMimicV2 是由阿里蚂蚁集团推出的开源数字人项目,旨在生成高质量的数字人半身动画视频。以下是该项目的简介:
机器学习是魔鬼1 个月前
数字人·图片处理·视频处理·魔改·hellomeme
HelloMeme 上手即用教程HelloMeme是一个集成空间编织注意力的扩散模型,用于生成高保真图像和视频。它提供了一个代码库,包含实验代码和预训练模型,支持PyTorch和FFmpeg。用户可以通过简单的命令行操作来生成图像和视频。
Slientsakke2 个月前
计算机视觉·aigc·数字人·视频生成·超分辨率
Hallo2 长视频和高分辨率的音频驱动的肖像图像动画 (数字人技术)HALLO2: LONG-DURATION AND HIGH-RESOLUTION AUDIO-DRIVEN PORTRAIT IMAGE ANIMATION
算家云2 个月前
人工智能·深度学习·3d·数字人·说话头·智能修复·面部同步
synctalk模型部署教程在合成逼真的语音驱动的说话头视频时,实现高度同步是一项重大挑战。传统的生成对抗网络 (GAN) 难以保持一致的面部身份,而神经辐射场 (NeRF) 方法虽然可以解决这个问题,但通常会产生不匹配的唇部运动、不充分的面部表情和不稳定的头部姿势。栩栩如生的说话头需要同步协调主体身份、唇部运动、面部表情和头部姿势。缺乏这些同步是一个根本缺陷,导致不切实际和人为的结果。
龚子亦3 个月前
unity·数字人·vroidstudio·vrm
解决VRM格式模型在Unity中运行出现头发乱飞等问题通过VRoidStudio制作导出的vrm格式的模型,放在unity中使用时,一运行就会出现头发乱飞,没有自然下垂的问题
龚子亦3 个月前
人工智能·unity·数字人·虚拟现实·blendshape·嘴型驱动·vroidstudio
为VRoidStudio制作的vrm格式模型制作blendshapebs视频演示下载网址:https://vroid.com/en/studio下载网址:https://github.com/vrm-c/UniVRM/releases 注意:unity版本要在2021.3 LTS及以上,VRM1.0和VRM0.x,要下载对应的插件
网安-搬运工4 个月前
人工智能·自然语言处理·llm·大语言模型·数字人·ai大模型·rag
揭秘AI数字人:RAG技术如何重塑数字人交互新纪元(一)大家好,今天我想与大家分享一个我非常热衷的话题——数字人。作为一名深度参与数字人项目的从业者,我有幸见证了这一领域的快速发展和无限潜力。
知来者逆4 个月前
人工智能·深度学习·数字人·虚拟现实·虚拟人·3d数字人
AVI-Talking——能通过语音生成很自然的 3D 说话面孔论文地址:https://arxiv.org/pdf/2402.16124v1.pdf逼真的人脸三维动画在娱乐业中至关重要,包括数字人物动画、电影视觉配音和虚拟化身的创建。以往的研究曾试图建立动态头部姿势与音频节奏之间的关联模型,或使用情感标签或视频剪辑作为风格参考,但这些方法的表现力有限,无法捕捉到情感的细微差别。它们还要求用户手动选择风格源,这往往会导致应用不自然。
RoronoaV5874 个月前
人工智能·数字人·live2d·文本转语音
live2d + edge-tts 优雅的实现数字人讲话 ~之前有想做数字人相关项目,查了一些方案。看了一些三方大厂的商用方案,口型有点尴尬,而且很多是采用视频流的方案,对流量的消耗很大。后来了解了live2d 技术,常在博客网页上见到的看板娘就是live2d技术实现的 ~
春末的南方城市5 个月前
人工智能·计算机视觉·aigc·音视频·数字人
ECCV2024,清华&百度提出ReSyncer:可实现音频同步嘴唇动作视频生成。清华&百度等联合提出了ReSyncer,可以实现更高稳定性和质量的口型同步,而且还支持创建虚拟表演者所必需的各种有趣属性,包括快速个性化微调、视频驱动的口型同步、说话风格的转换,甚至换脸。
喜好儿aigc6 个月前
microsoft·微软·数字人·文本转语音·gpt-4o
微软推出集成GPT-4o的文本转语音虚拟数字人服务微软近日宣布,其全新的文本转语音虚拟数字人服务正式上线,并集成了GPT-4o技术。这一服务为用户提供了创建实时互动数字人的可能。通过先进的自然语言处理技术,数字人能够将文本转化为自然流畅的语音,并配以生动的虚拟形象,实现与用户的实时互动。
JackieZhengChina6 个月前
人工智能·数字人·白皮书
快速了解《大模型赋能下的AI2.0数字人平台》白皮书在生成式AI和大模型的赋能下,数字人迎来AI 2.0时代。它能否成为每个人的“数字分身”,转化为新型的AI劳动力工具?商汤科技与上海市人工智能技术协会、零壹智库、增强现实核心技术产业联盟联合发布《大模型赋能下的AI 2.0数字人平台》。《白皮书》不仅总结了生成式AI和大模型对数字人的推动作用,还提出业界首个“AI 2.0数字人平台评估体系”,为AI 2.0时代数字人行业发展提供参考。
cha1116 个月前
人工智能·数字人·ai大模型·ai复活
AI复活亲人市场分析:技术、成本与伦理挑战“起死回生”这种事,过去只存在于科幻电影里,但今年,被“复活”的案例却越来越多。2月底,知名音乐人包晓柏利用AI“复活”了她的女儿,让她在妈妈生日时唱了一首生日歌;3月初,商汤科技的年会上,刚刚去世不久的创始人汤晓鸥以数字人的形式被“复活”,并进行了风格独特的演讲;近日,有网友用AI技术“复活”了李玟、乔任梁等已逝明星,掀起了巨大的争议。
老艾的AI世界6 个月前
人工智能·深度学习·ai·数字人·ai数字人
川普真会说中文?连嘴型都同步,VideoReTalking AI数字人下载介绍你能想到这种画面吗?霉霉在节目中用普通话接受采访,特朗普在老家用中文脱口秀,蔡明老师操着一口流利的英文调侃潘长江老师..
MonkeyKing_sunyuhua6 个月前
python·数字人
搭建musetalk数字人的步骤(建议使用 python 版本 >=3.10 和 cuda 版本 =11.7。)注意:这一步可能提示错误,跳过即可
此人姓于名叫罩百灵7 个月前
论文阅读·人工智能·aigc·数字人
论文笔记:Image Anaimation经典论文-运动关键点模型(Monkey-Net)Monkey-Net(MOviNg KEYpoints) paper: https://arxiv.org/pdf/1812.08861, CVPR 2019 code: https://github.com/AliaksandrSiarohin/monkey-net/tree/master