对标 GPT-4o 的开源实时语音多模态模型:Moshi

是由法国的 AI 实验室 Kyutai 推出的实时语音多模态模型,支持听、说、看,最关键的是你现在就可以在浏览器中使用,如果这个链接延迟高,可以试试这个, 无需输入邮箱,点击 Join queue 即可。

简单体验了下,比较笨笨的,延迟很低,可以随时打断,如果你一直不说话还会主动找你,很接近 GPT-4o 了!非常期待后续的开源。

相关推荐
小敬爱吃饭几秒前
知识图谱实战第一章:知识图谱全景解析其定义、技术演进与十大应用场景
人工智能·python·目标检测·自然语言处理·flask·nlp·知识图谱
Jump 不二几秒前
揭秘腾讯 Ima 知识库架构:从开源 WeKnora 看 RAG + 知识图谱落地实践
人工智能·语言模型·架构·机器人·开源·知识图谱
武汉知识图谱科技1 分钟前
神经符号AI+知识图谱:可信认知智能新纪元
人工智能
鹏子训3 分钟前
六个典型热门AI记忆架构对比:Mem0,Letta,MemoryLake,ZenBrain,MIA,MSA 助你快速选型
人工智能·架构·长短时记忆网络
xier_ran3 分钟前
知识图谱(Knowledge Graph)详解
人工智能·知识图谱
P-ShineBeam3 分钟前
知识图谱-基本知识图谱知识概览
人工智能·自然语言处理·知识图谱
UCloud_TShare15 分钟前
优刻得×上科大联合研发:UPFS开启AI存储性能新阶段
人工智能
三无推导18 分钟前
深入解析 ComposioHQ/awesome-codex-skills:从 Prompt 复用到 AI 工程技能化的实践路径
人工智能·性能优化·开源·prompt·github
xinwenmeiti20 分钟前
聚焦工业物流智能化升级 开途科技携全矩阵产品闪耀LogiMAT China 2026
人工智能
AI科技星24 分钟前
人类首张【全域数学公理体系】黑洞内部结构图—基于「0-1-∞」三元本源的全维深度解析
人工智能·算法·机器学习·数学建模·数据挖掘·量子计算