Soul App创始人张璐团队亮相GITEX GLOBAL 2024,展示多模态AI的交互创新

随着全球AI领域的竞争加剧,越来越多的科技巨头和创新企业纷纷致力于多模态AI的开发。2024年10月14日至18日,GITEX GLOBAL海湾信息技术博览会在迪拜举行,吸引了超过6700家全球科技巨头和创新公司参与,展示了智能互联、人工智能等领域的新成果。

此次展会中,Soul App创始人张璐团队携自主研发的多模态AI交互模型首次亮相。该模型具备3D虚拟人生成、多模态理解、多语种和语音通话等多项创新功能,进一步深化了拓展社交互动场景的可能性。

Soul团队此次展示的多模态AI交互方案,是在3D虚拟人技术和多模态理解方面的全新尝试。通过该方案,用户可以快速生成一个与自身相似的虚拟化身,与人进行自然、流畅的互动沟通。这种创新的交互模式不仅增强了虚拟形象的个性化,还能够在不依赖于真实外貌的前提下,为用户带来舒适、轻松的社交体验。

大会现场,借助展会设备,参与体验的用户十秒内便可完成3D虚拟人建模。在互动过程中,系统能精准捕捉并还原用户的面部特征与动作,让参与者可以体验到更加生动、自然的交流方式。

其实自创立以来,Soul一直致力于通过技术提升社交平台的多样性和体验感。为了能让用户自在地分享兴趣爱好、表达自我,Soul不支持用户上传真实照片,而是鼓励用户通过"捏脸"功能,创建个性化虚拟形象。

2022年,Soul推出了自研引擎,进一步增强了虚拟形象的表现力。该引擎基于AI、渲染与图像处理等核心技术,可以帮助用户创建出富有个性的3D虚拟社交形象。在此次GITEX GLOBAL上亮相的多模态AI交互方案正是对该引擎能力的进一步延伸,为线上社交体验注入更多真实感。

Soul的多模态AI模型具备端到端处理能力,能够理解文字、语音、图像等多模态信息,从而实现接近人类的交流体验。这种高度拟人化的AI交互方案源于Soul在人工智能领域的长期技术积累。

自2020年启动AI技术研发计划以来,Soul团队已陆续推出了自研的语言大模型Soul X、语音生成大模型、语音识别大模型等一系列技术成果。今年,Soul还进一步推出了全双工语音通话大模型,实现了超低交互延迟、快速自动打断以及高度真实的声音表达与情绪感知理解,为用户提供了"类真人"的陪伴体验。

在多模态AI技术的支持下,Soul已实现了"数字分身"功能。用户授权后,平台可以基于其聊天记录、内容偏好等,定制虚拟人的形象与特征,从而在视觉、语言风格、身份特征和情感表达等方面达到高度还原。数字分身不仅能为用户提供智能回复推荐,还能通过模拟人类的情绪和反应,帮助用户在社交破冰、关系建立等环节提升沟通效率,使虚拟人真正成为数字世界中的"社交助手"。

此次亮相GITEX GLOBAL,Soul App创始人张璐团队不仅展示了Soul在3D虚拟人、语音通话、情绪理解等多模态AI技术方面的成果,也为海外嘉宾呈现了中国企业在社交科技领域的创新探索。

相关推荐
aircrushin2 小时前
从春晚看分布式实时协同算法与灵巧手工程实现
人工智能·机器人
恋猫de小郭2 小时前
Apple 的 ANE 被挖掘,AI 硬件公开,宣传的 38 TOPS 居然是"数字游戏"?
前端·人工智能·ios
银河系搭车客指南2 小时前
AI Agent 的失忆症:我是怎么给它装上"第二个大脑"的
人工智能
张拭心2 小时前
春节后,有些公司明确要求 AI 经验了
android·前端·人工智能
我的username3 小时前
极致简单的openclaw安装教程
人工智能
小锋java12343 小时前
【技术专题】嵌入模型与Chroma向量数据库 - Chroma 集合操作
人工智能
七月丶3 小时前
别再手动凑 PR 了:这个 AI Skill 会按仓库习惯自动建分支、拆提交、提 PR
人工智能·设计模式·程序员
用户5191495848453 小时前
CVE-2024-10793 WordPress插件权限提升漏洞利用演示
人工智能·aigc
chaors4 小时前
从零学RAG0x01之向量化
人工智能·aigc·ai编程
chaors4 小时前
从零学RAG0x02向量数据库
人工智能·aigc·ai编程