Seamless:Facebook推出的跨语言语音识别/翻译/合成大模型Seamless 是一系列 AI 模型,旨在实现更自然和真实的跨语言沟通。SeamlessM4T 是一个支持约 100 种语言的大规模多语言多模态机器翻译模型。SeamlessM4T 是 SeamlessExpressive 的基础,后者能够在不同语言间保留语调和声音风格的元素,同时 SeamlessStreaming 则支持同时翻译和流式语音识别(ASR)。SeamlessExpressive 和 SeamlessStreaming 被整合为 Seamless,一个统一模型,具备多语言、实时和富有表现力