Soul App创始人张璐团队亮相GITEX GLOBAL 2024,展示多模态AI的交互创新

随着全球AI领域的竞争加剧,越来越多的科技巨头和创新企业纷纷致力于多模态AI的开发。2024年10月14日至18日,GITEX GLOBAL海湾信息技术博览会在迪拜举行,吸引了超过6700家全球科技巨头和创新公司参与,展示了智能互联、人工智能等领域的新成果。

此次展会中,Soul App创始人张璐团队携自主研发的多模态AI交互模型首次亮相。该模型具备3D虚拟人生成、多模态理解、多语种和语音通话等多项创新功能,进一步深化了拓展社交互动场景的可能性。

Soul团队此次展示的多模态AI交互方案,是在3D虚拟人技术和多模态理解方面的全新尝试。通过该方案,用户可以快速生成一个与自身相似的虚拟化身,与人进行自然、流畅的互动沟通。这种创新的交互模式不仅增强了虚拟形象的个性化,还能够在不依赖于真实外貌的前提下,为用户带来舒适、轻松的社交体验。

大会现场,借助展会设备,参与体验的用户十秒内便可完成3D虚拟人建模。在互动过程中,系统能精准捕捉并还原用户的面部特征与动作,让参与者可以体验到更加生动、自然的交流方式。

其实自创立以来,Soul一直致力于通过技术提升社交平台的多样性和体验感。为了能让用户自在地分享兴趣爱好、表达自我,Soul不支持用户上传真实照片,而是鼓励用户通过"捏脸"功能,创建个性化虚拟形象。

2022年,Soul推出了自研引擎,进一步增强了虚拟形象的表现力。该引擎基于AI、渲染与图像处理等核心技术,可以帮助用户创建出富有个性的3D虚拟社交形象。在此次GITEX GLOBAL上亮相的多模态AI交互方案正是对该引擎能力的进一步延伸,为线上社交体验注入更多真实感。

Soul的多模态AI模型具备端到端处理能力,能够理解文字、语音、图像等多模态信息,从而实现接近人类的交流体验。这种高度拟人化的AI交互方案源于Soul在人工智能领域的长期技术积累。

自2020年启动AI技术研发计划以来,Soul团队已陆续推出了自研的语言大模型Soul X、语音生成大模型、语音识别大模型等一系列技术成果。今年,Soul还进一步推出了全双工语音通话大模型,实现了超低交互延迟、快速自动打断以及高度真实的声音表达与情绪感知理解,为用户提供了"类真人"的陪伴体验。

在多模态AI技术的支持下,Soul已实现了"数字分身"功能。用户授权后,平台可以基于其聊天记录、内容偏好等,定制虚拟人的形象与特征,从而在视觉、语言风格、身份特征和情感表达等方面达到高度还原。数字分身不仅能为用户提供智能回复推荐,还能通过模拟人类的情绪和反应,帮助用户在社交破冰、关系建立等环节提升沟通效率,使虚拟人真正成为数字世界中的"社交助手"。

此次亮相GITEX GLOBAL,Soul App创始人张璐团队不仅展示了Soul在3D虚拟人、语音通话、情绪理解等多模态AI技术方面的成果,也为海外嘉宾呈现了中国企业在社交科技领域的创新探索。

相关推荐
لا معنى له4 小时前
目标检测的内涵、发展和经典模型--学习笔记
人工智能·笔记·深度学习·学习·目标检测·机器学习
AKAMAI5 小时前
Akamai Cloud客户案例 | CloudMinister借助Akamai实现多云转型
人工智能·云计算
小a杰.7 小时前
Flutter 与 AI 深度集成指南:从基础实现到高级应用
人工智能·flutter
colorknight7 小时前
数据编织-异构数据存储的自动化治理
数据仓库·人工智能·数据治理·数据湖·数据科学·数据编织·自动化治理
Lun3866buzha7 小时前
篮球场景目标检测与定位_YOLO11-RFPN实现详解
人工智能·目标检测·计算机视觉
janefir7 小时前
LangChain框架下DirectoryLoader使用报错zipfile.BadZipFile
人工智能·langchain
齐齐大魔王8 小时前
COCO 数据集
人工智能·机器学习
AI营销实验室9 小时前
原圈科技AI CRM系统赋能销售新未来,行业应用与创新点评
人工智能·科技
爱笑的眼睛119 小时前
超越MSE与交叉熵:深度解析损失函数的动态本质与高阶设计
java·人工智能·python·ai
tap.AI9 小时前
RAG系列(一) 架构基础与原理
人工智能·架构