技术栈
数字人
西安老张(AIGC&ComfyUI)
1 小时前
aigc
·
音视频
·
数字人
·
comfyui
第021章:ComfyUI文生音频Qwen3-TTS模型数字人音色设计(一)
在第019章里我们生成了一个数字人模特“小一”,本来想着先通过给“小一”换装、换背景,来个大家讲一下图像编辑模型的使用。
RTC实战笔记
4 天前
音视频
·
数字人
·
rtc
·
数字人接入
实时互动数字人怎么做,才不是一个只会说话的视频?
过去大家说数字人,更多是在问口播、短视频、直播间素材、品牌宣传片。现在越来越多需求变成了:用户能不能直接问问题?数字人能不能实时回答?能不能接知识库?能不能在展厅、App、网页、客服入口里直接互动?这两类需求看起来都叫“数字人”,技术实现却不是一回事。如果只是口播视频,本质是内容生成链路;如果要实时问答,本质是实时互动系统。后者不只需要一个形象,还需要语音、网络、知识库、大模型、音视频流、业务流程和异常兜底一起工作。
兜里只有三分钱~
17 天前
数学建模
·
数字人
·
数字
快递索赔场景评测|魔珐星云职场法务数字人线下落地实测
本次测试落地于社区便民服务站、快递驿站,聚焦快递丢损、理赔纠纷高频民生问题,完成魔珐星云法务数字人实地测试,记录真实落地数据与使用效果。
wei_shuo
20 天前
数字人
基于魔珐星云打造的心理咨询师数字人:情绪疏导、压力管理、语音随时交互
心理健康问题正在成为现代人的隐形杀手。工作压力、人际冲突、情感困扰,很多人独自承受却无处倾诉。找心理咨询师?费用高昂、预约困难、还要担心隐私问题。心理咨询师数字人的出现,正是要打破这些障碍,让心理支持触手可及。
lipku
23 天前
python
·
开源
·
数字人
·
vllm
·
实时数字人
LiveTalking 更新:集成 vLLM-Omni TTS服务
LiveTalking 最近完成了一次重要的基础设施升级——引入 vLLM-Omni 作为 TTS 推理引擎,并在单张 RTX 3090 上实现了 130ms 首包延迟、13GB 显存占用的流式语音合成。本文从技术角度梳理这次更新的设计思路与实现细节。
wei_shuo
23 天前
数字人
基于魔珐星云打造的金融理财顾问数字人:投资理财、财务规划、语音随时交互
理财是一门学问,但专业理财顾问的门槛让很多人望而却步——高昂的咨询费、复杂的金融术语、难以判断的建议可靠性。金融理财顾问数字人的出现,正是要打破这些壁垒,让每个人都能获得客观专业的理财指导。
武子康
1 个月前
人工智能
·
python
·
深度学习
·
ai
·
数字人
调查研究-155 Open-LLM-VTuber 本地部署与互动实战指南
在本地搭建一个能听、能说、有形象的 AI 数字人,曾经是只有大型实验室才能玩转的黑科技。但随着开源社区的爆发式增长,现在只要有一台配置尚可的个人电脑,普通开发者也能在几个小时内让虚拟角色“活”起来。很多同学在尝试过程中,往往卡在环境依赖的迷宫里,或者模型加载后迟迟无法开口,甚至因为显存溢出导致程序直接崩溃。这些痛点不仅消磨热情,更让人误以为本地部署高不可攀。
平头哥~
1 个月前
数字人
健康饮食新范式!魔珐星云智能膳食规划AI助手
本项目基于Vue3 + TS前端架构开发,依托魔珐星云3D数字人开放平台,打造轻量化智能膳食规划AI助手。针对大众日常饮食搭配混乱、减脂控卡无方案、三餐规划不科学、饮食疑问无人解答等痛点,以3D数字人交互形式,提供个性化膳食推荐、饮食答疑、健康吃法科普等服务,实现轻量化、高流畅、可落地的智能膳食辅助体验。
七夜zippoe
1 个月前
重构
·
交互
·
数字人
·
deepseek
·
魔珐星云
重构数字人交互体验:魔珐星云+DeepSeek打造情绪陪伴数字人全流程实战测评
目录摘要1. 引言:当数字人有了"情绪",事情就不一样了1.1 数字人的尴尬现状1.2 为什么"情绪陪伴"是一个理想的实验场景
Want595
1 个月前
人工智能
·
数字人
数字人场景落地:企业展厅 / 指挥大屏从展示到服务
企业展厅、指挥中心等实体场地的传统 BI 大屏,长期是「静态数据墙」:满屏图表看不懂、现场没人讲、参观留不下记忆。市面上数字人虽能做基础交互,但强网依赖、延迟高、成本贵,只适合线上演示,根本落不了实体场地。本文基于魔星云端侧数字人 + DeepSeek,聚焦企业实体场地落地,把大屏从静态展示升级为场地专属数据讲解数字人,一套方案适配展厅参观、指挥调度两大真实场景,实现从「场地看数据」到「场地聊数据」的落地跃迁。
七夜zippoe
2 个月前
人工智能
·
数字人
·
bi
·
deepseek
·
魔珐星云
企业大屏升级AI智能体:魔珐星云+DeepSeek打造BI数据讲解数字人
目录摘要1. 引言:大屏的沉默困境1.1 传统BI大屏的痛点1.2 为什么不让大屏"开口说话"?1.3 本文目标
CodingPioneer
2 个月前
人工智能
·
信息可视化
·
数字人
·
魔珐星云
·
星云具身
智屏问数 · AI数字人驱动的车间数字大屏
工业数据可视化 + 星云具身数字人+ AI智能分析,让车间的每一组数据都能开口说话。生产车间是工业企业的核心生产环节,涉及生产、工艺、设备、库存、质量等多个维度的数据。传统模式下,数据分散在不同系统中,管理人员需要切换多个界面才能了解产量、质量、设备效率等关键指标,而简单的通过数据难以快速发现异常并做出决策,结合星云具身数字人和AI大模型,不仅改善了交互体验,还可以快速通过数据智能分析诊断发现异常帮助管理层迅速做出应对决策。
落798.
2 个月前
数字人
·
魔珐星云
从 LLM 到具身 Agent:魔珐星云 SDK 与端侧参数流渲染架构深度实践
最近接了一个有点意思的项目:某科技馆希望在展厅入口部署一块竖屏,作为 AI 讲解员,接管原本由真人讲解员承担的导览、问答、引路工作。
国服第二切图仔
2 个月前
人工智能
·
交互
·
数字人
·
魔珐星云
3 分钟快速实战:基于魔珐星云 SDK 搭建低延迟可交互 AI 数字人
从大模型到 AI Agent,智能系统已具备强大的理解与决策能力,但如何让 AI 实现拟人化、实时流畅的表达,依然是落地过程中的核心难题。 当前行业普遍面临交互体验与工程成本的双重困境:普通数字人依赖云端渲染与视频流推送,不仅响应迟缓,也不支持用户实时打断,难以满足真实对话场景;而自主搭建方案需要串联语音、渲染、动作等多套系统,开发复杂度高、延迟与成本居高不下。 魔珐星云作为 AI 屏幕操作系统与具身智能表达基础设施,能否打破这些局限,让开发者快速实现可交互、低延迟、低成本的数字人落地?本文将通过极简代码
德宏大魔王(AI自动回关)
2 个月前
人工智能
·
交互
·
数字人
·
魔珐星云
3分钟实战,用魔珐星云SDK构建你的可交互AI数字人
从 ChatGPT 到 AI Agent,大模型有了强大的“大脑”,但如何让它像人一样自然“表达”?这是当前 AI 落地最大的痛点之一。
CodingPioneer
2 个月前
数字人
·
魔珐星云
·
星云具身
基于魔珐星云的虚拟人实时天气助手
日常出行前天气查询、跨城出行天气规划、家庭出行前天气确认、办公场景下快速获取多城市天气等高频天气查询场景;同时覆盖对传统文字/图标式天气查询不熟悉的群体(如老年群体)、追求交互趣味性的年轻群体的使用场景。 当前现状:
wei_shuo
2 个月前
3d
·
数字人
·
魔珐星云
零门槛开发 3D 数字人:魔珐星云开放平台接入实战
魔珐星云是魔珐科技打造的具身智能3D数字人开放平台,打通人工智能大模型与三维数字人体态交互,依托高精度写实数字建模、实时语音表情驱动、自然语义对话、端侧轻量化渲染等核心技术,让数字人具备自然流畅的语音交流、丰富细腻的面部神态与肢体动作,实现高拟人度、低延迟、多终端适配的智能交互,广泛应用于智能客服、虚拟主播、知识科普、政企陪伴、AI虚拟助手等场景,一站式赋能各行各业落地智能化具身数字人应用。
todoitbo
2 个月前
人工智能
·
信息可视化
·
数字人
·
大屏可视化
·
魔珐星云
从“会展示”到“会讲解”:基于魔珐星云 + 大模型打造企业数字展厅AI讲解员(开源实战)
如果你也在做企业展厅、管理驾驶舱、发布会大屏,想让“数据可视化”真正走向“可理解、可互动、可运营”,这篇实战直接复用。 演示视频:https://www.bilibili.com/video/BV1NwikBUEmf 魔珐星云邀请码(新用户可用):J3GAY6LS8W,(要使用专属邀请码)可免费获取1000积分,体验数字人2000分钟!
Front_Yue
2 个月前
人工智能
·
数字人
·
数据可视化
·
魔珐星云
·
可视化方案
魔珐星云在智慧文旅项目中的全流程技术拆解
本文将深入剖析魔珐星云数字人技术在智慧文旅场景中的完整技术实现,从架构设计到核心代码,带你领略AI数字人如何赋能传统文旅行业。
CV-deeplearning
3 个月前
音视频
·
数字人
·
视频生成
·
infinitetalk
·
说话视频
美团 AI 开源!一段音频驱动无限时长说话视频,嘴唇/头部/表情全同步,支持 ComfyUI 一键部署
一句话介绍:InfiniteTalk 是美团 MeiGen-AI 团队开源的音频驱动视频生成框架,基于 Wan2.1-14B 大模型,支持图片/视频转说话视频,无限时长生成,嘴唇、头部动作、身体姿态、面部表情全部跟着音频走。