数字人

未来之窗软件服务6 天前
数字人·语音大模型
F5-TTS文本语音生成模型-CPU版本安装-数字人之语音驱动9G大小修改系统缓存目录由于解压到了C盘不够,安装后没有自己删除,手动删除一下C:\Users\当前用户名\AppData\Roaming\F5-TTS-CPU\installer
玩电脑的辣条哥9 天前
linux·ubuntu·数字人·aispherebutler·livetalking·metahumastream·ai全能管家
Ubuntu如何部署AI-Sphere-Butler(metahuman-stream)Ubuntu 20.04、22.04Python3.10Pytorch 1.12CUDA 11.3Ubuntu如何部署AI-Sphere-Butler(metahuman-stream(LiveTalking))
Polaris_T10 天前
数字人·cvpr 2025·3d生成
CVPR 2025 | 文本和图像引导的高保真3D数字人高效生成GaussianIP小小宣传一下CVPR 2025的工作GaussianIP。 arXiv:https://arxiv.org/abs/2503.11143 Github:https://github.com/silence-tang/GaussianIP 欢迎star, issue~
未来之窗软件服务14 天前
linux·运维·服务器·数字人
lite_avatar 数字人命令行-安装故障解决pip install librosapip install logurupip install pydub
未来之窗软件服务14 天前
人工智能·llama·数字人
数字人本地部署之llama-本地推理模型llama-server.exe -m "data/LLM/my.gguf" --port 8080-m 属于命令行选项,一般用来指定要加载的模型文件。
---yx89897823 天前
算法·架构·数字人·数字人源码·数字人系统
数字人系统源码---v10技术五大底层架构链路全局开发思路#数字人系统##数字人系统V10独家源头技术开发分享#数字人系统源码的 V10 技术五大底层架构链路开发是比较复杂且专业的内容,以下为你简单介绍可能涉及的技术开发思路
jimumeta24 天前
3d·数字人·虚拟展厅·3d展厅
一站式3D虚拟展厅搭建方案,让企业展示更高效在数字化浪潮中,众多企业倾向于采用线上3D虚拟展厅来展现其产品特色、环境风貌及企业实力。然而,构建一个高质量的3D虚拟展厅不仅要求专业的技术背景,还需投入大量的时间和人力资源。视创云展能够以低成本高效率地搭建3D虚拟展厅,通过整合虚拟数字人与虚拟场景,促进虚拟环境中的多人互动,营造出一种超沉浸式的“零距离”社交体验。
LhcyyVSO1 个月前
科技·数字人·蓝海创意云·影视动画·虚拟拍摄
蓝陵科技:以“数字底座”之力,全面布局影视行业工业化“在数字技术与文化产业深度融合的今天,海南蓝陵数字科技有限公司(以下简称蓝陵科技)凭借其卓越的渲染实力和前瞻性的战略布局,正逐步成为推动中国影视行业工业化进程的重要力量。2025年2月,蓝陵科技不仅获得了陵水融媒体中心的深入报道,更在海南日报的头版位置上大放异彩,以其为《哪吒之魔童闹海》(以下简称《哪吒2》)提供的高质量渲染服务为焦点,展现了公司在影视渲染领域的非凡实力。”
AI完全体1 个月前
人工智能·语音识别·智能客服·数字人·声音克隆·虚拟主播·视觉建模
【AI应用】数字人涉及的一些主要 AI 技术【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI日记】【读书与思考】【AI应用】在 数字人搭建 过程中,涉及多个 AI 技术,包括 训练微调、算法、图像合成、声音克隆,每个部分都决定了最终效果的真实度、交互流畅度和个性化能力。下面是各个模块的详细解析:
产品媛Gloria Deng2 个月前
ai·音视频·数字人·talking head·aniportrait框架
数字人|通过语音和图片来创建高质量的视频arXiv上的计算机视觉领域论文:AniPortrait: Audio-Driven Synthesis of Photorealistic Portrait Animation
如一@深声科技2 个月前
数字人·照片数字人·数字人定制·对口型数字人·交互数字人·数字人方案
革新未来:高效智能数字人技术引领多元化应用随着科技的不断进步,数字人技术已逐渐成为企业数字化转型中的重要工具。数字人不仅能够优化客户体验,还可以显著提升企业运营效率。本文将详细介绍一种高性能、高质量、低延迟、快速响应以及安全稳定的数字人技术方案,帮助企业在多元化场景中实现数字人技术的落地应用。
嘟嘟实验室2 个月前
人工智能·macos·aigc·数字人
LatentSync数字人,一键批量,口型同步,MPS加速(WIN/MAC)分享一个最近还不错的数字人项目——LatentSync。该项目由字节开源,上传一段音频和视频,即可生成数字人视频。
如一@深声科技3 个月前
数字人·数字人定制·数字人私有化·123数字人·对口型数字人
数字人技术:未来创新的驱动力在当今数字化转型的时代,数字人技术正逐渐成为各个行业的重要工具。通过提供高性能、高质量、低延迟以及快速响应的数字人API服务,企业能够实现多样化的应用场景,并显著提升用户的交互体验。
木亦汐丫3 个月前
大模型·数字人·口型同步·musev·musetalk·ffmpeg-static
【大模型系列篇】数字人音唇同步模型——腾讯开源MuseTalk之前有一期我们体验了阿里开源的半身数字人项目EchoMimicV2,感兴趣的小伙伴可跳转至《AI半身数字人开箱体验——开源项目EchoMimicV2》,今天带大家来体验腾讯开源的数字人音唇同步模型MuseTalk。
嘟嘟实验室3 个月前
人工智能·python·macos·aigc·数字人·facefusion
FaceFusion3.1.1,deepfacelive模型使用教程,BUG修复,云端镜像支持就在昨天FaceFusion迎来了3.1.1版本更新。不过本次更新内容比较简单,仅修复了MAC系统上CoreML回退的问题。
编程迪3 个月前
小程序·数字人·去水印·短视频文案提取·文案改写创作
开源数字人系统源码短视频文案提取文案改写去水印小程序短视频去水印:文案提取与改写:数字人系统应用:综合应用:软件订阅费单次使用费广告收入增值服务企业合作与定制
AIGC安琪3 个月前
人工智能·stable diffusion·数字人·sd·sd教程
只需3步,使用Stable Diffusion无限生成AI数字人视频先看效果,感兴趣的可以继续读下去。没有找到可以上传视频的地方,大家打开这个链接可以看到:www.aliyundrive.com/s/CRBm5NL3x…
算家云4 个月前
人工智能·大模型·aigc·音视频·数字人·智能对话·动态图像
重塑视频新语言,让每一帧都焕发新生——Video-Retalking,开启数字人沉浸式交流新纪元!Video-Retalking 模型是一种基于深度学习的视频再谈话技术,它通过分析视频中的音频和图像信息,实现视频角色口型、表情乃至肢体动作的精准控制与合成。这一技术的实现依赖于强大的技术架构和核心算法,特别是生成对抗网络(GAN)等先进算法的应用。
PLUS_WAVE4 个月前
学习·计算机视觉·数字人·三维重建·3d gaussian·3dgs·headavatar
GAGAvatar: Generalizable and Animatable Gaussian Head Avatar 学习笔记GAGAvatar(Generalizable and Animatable Gaussian Avatar),一种面向单张图片驱动的可动画化头部头像重建的方法,解决了现有方法在渲染效率和泛化能力上的局限。 旋转参数
云樱梦海4 个月前
音视频·数字人·echomimicv2
阿里发布 EchoMimicV2 :从数字脸扩展到数字人 可以通过图片+音频生成半身动画视频EchoMimicV2 是由阿里蚂蚁集团推出的开源数字人项目,旨在生成高质量的数字人半身动画视频。以下是该项目的简介: