Soul App创始人张璐团队亮相GITEX GLOBAL 2024,展示多模态AI的交互创新

随着全球AI领域的竞争加剧,越来越多的科技巨头和创新企业纷纷致力于多模态AI的开发。2024年10月14日至18日,GITEX GLOBAL海湾信息技术博览会在迪拜举行,吸引了超过6700家全球科技巨头和创新公司参与,展示了智能互联、人工智能等领域的新成果。

此次展会中,Soul App创始人张璐团队携自主研发的多模态AI交互模型首次亮相。该模型具备3D虚拟人生成、多模态理解、多语种和语音通话等多项创新功能,进一步深化了拓展社交互动场景的可能性。

Soul团队此次展示的多模态AI交互方案,是在3D虚拟人技术和多模态理解方面的全新尝试。通过该方案,用户可以快速生成一个与自身相似的虚拟化身,与人进行自然、流畅的互动沟通。这种创新的交互模式不仅增强了虚拟形象的个性化,还能够在不依赖于真实外貌的前提下,为用户带来舒适、轻松的社交体验。

大会现场,借助展会设备,参与体验的用户十秒内便可完成3D虚拟人建模。在互动过程中,系统能精准捕捉并还原用户的面部特征与动作,让参与者可以体验到更加生动、自然的交流方式。

其实自创立以来,Soul一直致力于通过技术提升社交平台的多样性和体验感。为了能让用户自在地分享兴趣爱好、表达自我,Soul不支持用户上传真实照片,而是鼓励用户通过"捏脸"功能,创建个性化虚拟形象。

2022年,Soul推出了自研引擎,进一步增强了虚拟形象的表现力。该引擎基于AI、渲染与图像处理等核心技术,可以帮助用户创建出富有个性的3D虚拟社交形象。在此次GITEX GLOBAL上亮相的多模态AI交互方案正是对该引擎能力的进一步延伸,为线上社交体验注入更多真实感。

Soul的多模态AI模型具备端到端处理能力,能够理解文字、语音、图像等多模态信息,从而实现接近人类的交流体验。这种高度拟人化的AI交互方案源于Soul在人工智能领域的长期技术积累。

自2020年启动AI技术研发计划以来,Soul团队已陆续推出了自研的语言大模型Soul X、语音生成大模型、语音识别大模型等一系列技术成果。今年,Soul还进一步推出了全双工语音通话大模型,实现了超低交互延迟、快速自动打断以及高度真实的声音表达与情绪感知理解,为用户提供了"类真人"的陪伴体验。

在多模态AI技术的支持下,Soul已实现了"数字分身"功能。用户授权后,平台可以基于其聊天记录、内容偏好等,定制虚拟人的形象与特征,从而在视觉、语言风格、身份特征和情感表达等方面达到高度还原。数字分身不仅能为用户提供智能回复推荐,还能通过模拟人类的情绪和反应,帮助用户在社交破冰、关系建立等环节提升沟通效率,使虚拟人真正成为数字世界中的"社交助手"。

此次亮相GITEX GLOBAL,Soul App创始人张璐团队不仅展示了Soul在3D虚拟人、语音通话、情绪理解等多模态AI技术方面的成果,也为海外嘉宾呈现了中国企业在社交科技领域的创新探索。

相关推荐
Java与Android技术栈22 分钟前
macOS 为 Compose Desktop 构建跨平台图像库:OpenCV + libraw + libheif 实践
人工智能·opencv·macos·计算机视觉
物联网软硬件开发-轨物科技43 分钟前
【轨物方案】当补贴退潮,光伏电站如何回归价值本质?
人工智能·数据挖掘·回归
失序空间1 小时前
Datawhale AI夏令营 机器学习2.1
人工智能·机器学习
说私域1 小时前
链接型社群的数字化升级路径研究——基于开源链动2+1模式与AI智能名片的S2B2C商城小程序赋能视角
人工智能·小程序·开源
说私域1 小时前
基于开源AI智能名片链动2+1模式S2B2C商城小程序的营销直播质量提升策略研究
人工智能·小程序
触想工业平板电脑一体机1 小时前
触想CX-3588主板在安保巡检领域的落地实践:解锁机器人自主智能
人工智能·机器人
阿里云大数据AI技术1 小时前
跨国数仓迁移背后的统一存储格式创新-Append Delta Table
大数据·人工智能·数据分析
Danceful_YJ1 小时前
20.微调ResNet-18网络分类热狗数据集(失败版本)
人工智能·深度学习·resnet
沫儿笙1 小时前
焊接机器人智能节气阀
人工智能·机器人
Danceful_YJ1 小时前
17.使用DenseNet网络进行Fashion-Mnist分类
人工智能·深度学习·神经网络·densenet