Soul App创始人张璐团队亮相GITEX GLOBAL 2024,展示多模态AI的交互创新

随着全球AI领域的竞争加剧,越来越多的科技巨头和创新企业纷纷致力于多模态AI的开发。2024年10月14日至18日,GITEX GLOBAL海湾信息技术博览会在迪拜举行,吸引了超过6700家全球科技巨头和创新公司参与,展示了智能互联、人工智能等领域的新成果。

此次展会中,Soul App创始人张璐团队携自主研发的多模态AI交互模型首次亮相。该模型具备3D虚拟人生成、多模态理解、多语种和语音通话等多项创新功能,进一步深化了拓展社交互动场景的可能性。

Soul团队此次展示的多模态AI交互方案,是在3D虚拟人技术和多模态理解方面的全新尝试。通过该方案,用户可以快速生成一个与自身相似的虚拟化身,与人进行自然、流畅的互动沟通。这种创新的交互模式不仅增强了虚拟形象的个性化,还能够在不依赖于真实外貌的前提下,为用户带来舒适、轻松的社交体验。

大会现场,借助展会设备,参与体验的用户十秒内便可完成3D虚拟人建模。在互动过程中,系统能精准捕捉并还原用户的面部特征与动作,让参与者可以体验到更加生动、自然的交流方式。

其实自创立以来,Soul一直致力于通过技术提升社交平台的多样性和体验感。为了能让用户自在地分享兴趣爱好、表达自我,Soul不支持用户上传真实照片,而是鼓励用户通过"捏脸"功能,创建个性化虚拟形象。

2022年,Soul推出了自研引擎,进一步增强了虚拟形象的表现力。该引擎基于AI、渲染与图像处理等核心技术,可以帮助用户创建出富有个性的3D虚拟社交形象。在此次GITEX GLOBAL上亮相的多模态AI交互方案正是对该引擎能力的进一步延伸,为线上社交体验注入更多真实感。

Soul的多模态AI模型具备端到端处理能力,能够理解文字、语音、图像等多模态信息,从而实现接近人类的交流体验。这种高度拟人化的AI交互方案源于Soul在人工智能领域的长期技术积累。

自2020年启动AI技术研发计划以来,Soul团队已陆续推出了自研的语言大模型Soul X、语音生成大模型、语音识别大模型等一系列技术成果。今年,Soul还进一步推出了全双工语音通话大模型,实现了超低交互延迟、快速自动打断以及高度真实的声音表达与情绪感知理解,为用户提供了"类真人"的陪伴体验。

在多模态AI技术的支持下,Soul已实现了"数字分身"功能。用户授权后,平台可以基于其聊天记录、内容偏好等,定制虚拟人的形象与特征,从而在视觉、语言风格、身份特征和情感表达等方面达到高度还原。数字分身不仅能为用户提供智能回复推荐,还能通过模拟人类的情绪和反应,帮助用户在社交破冰、关系建立等环节提升沟通效率,使虚拟人真正成为数字世界中的"社交助手"。

此次亮相GITEX GLOBAL,Soul App创始人张璐团队不仅展示了Soul在3D虚拟人、语音通话、情绪理解等多模态AI技术方面的成果,也为海外嘉宾呈现了中国企业在社交科技领域的创新探索。

相关推荐
8Qi810 分钟前
多目标优化算法——多目标粒子群优化算法(MOPSO)
人工智能·算法·matlab·进化计算·群体智能
三月七(爱看动漫的程序员)1 小时前
Exploring Prompt Engineering: A Systematic Review with SWOT Analysis
人工智能·gpt·学习·语言模型·自然语言处理·chatgpt·prompt
L_cl2 小时前
【NLP 3、深度学习简介】
人工智能·深度学习
黄卷青灯772 小时前
NLP自然语言处理包含哪些方面?
人工智能·自然语言处理·nlp
Guofu_Liao2 小时前
大语言模型---RewardBench 介绍;RewardBench 的主要功能;适用场景
人工智能·语言模型·自然语言处理
Elastic 中国社区官方博客2 小时前
使用 Spring AI + Elasticsearch 让 RAG 变得简单
java·大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索
weixin_543662862 小时前
BERT的中文问答系统35
人工智能·深度学习·bert
想你依然心痛3 小时前
【AI赋能电商】探索人工智能在购物推荐、会员管理和商品定价中的创新应用及其对销售效率和用户体验的影响
人工智能·ux
baijin_cha3 小时前
深度学习基础02_损失函数&BP算法(上)
人工智能·笔记·深度学习