英伟达发布 PersonaPlex-7B-v1

与传统语音助手需要经过"语音识别 → 大语言模型 → 语音合成"多个独立环节不同，PersonaPlex的核心创新在于采用了端到端的单一Transformer模型。这种设计带来了根本性的体验提升：

该模型通过"语音+文本"双重引导来实现深度个性化，你可以像导演一样定义AI的角色：

技术基础 ：它基于 Kyutai 的 Moshi 架构 构建，拥有70亿参数，并采用 Helium 作为底层语言模型，支持对训练数据之外场景的泛化。
训练数据：为了同时获得"自然感"和"任务执行力"，其训练融合了超过1200小时的真实对话录音（学习自然的交谈习惯）和约2250小时的合成对话（学习遵循特定行业规则）。
评测表现：在专业评测中，该模型在对话流畅度、任务达成率和响应延迟方面均优于许多开源和闭源系统。
应用场景 ：其能力非常适合需要自然、实时交互的场景，如智能客服、虚拟助手、互动娱乐以及具身智能等。

官方资源 ：最权威的信息、技术论文和可能的模型权重，请访问 英伟达研究团队的官方介绍页面 （research.nvidia.com/labs/adlr/personaplex）。
开源信息：根据技术报道，其代码采用MIT许可证，模型权重采用NVIDIA开放模型许可证。你可以关注官方或相关开源社区以获取代码和模型。
体验方式：目前搜索结果中未提及公开的在线演示地址。要亲身体验，可能需要等待官方发布，或在Github等平台获取模型后自行部署。