对标 GPT-4o 的开源实时语音多模态模型:Moshi

是由法国的 AI 实验室 Kyutai 推出的实时语音多模态模型,支持听、说、看,最关键的是你现在就可以在浏览器中使用,如果这个链接延迟高,可以试试这个, 无需输入邮箱,点击 Join queue 即可。

简单体验了下,比较笨笨的,延迟很低,可以随时打断,如果你一直不说话还会主动找你,很接近 GPT-4o 了!非常期待后续的开源。

相关推荐
啊阿狸不会拉杆30 分钟前
人工智能数学基础(三):微积分初步
人工智能·python·算法·数学建模
蜂耘1 小时前
面向人工智能、量子科技、人形机器人等产业,山东启动制造业创新中心培育认定
人工智能·科技·机器人
深眸财经2 小时前
业绩回暖、股价承压,三只松鼠赴港上市能否重构价值锚点?
人工智能
AIwenIPgeolocation2 小时前
硬件加密+本地部署,大模型一体机如何打造AI安全护城河?
人工智能·安全
非凸科技2 小时前
非凸科技受邀出席AI SPARK活动,共探生成式AI驱动金融新生态
人工智能·科技·金融
啊阿狸不会拉杆3 小时前
人工智能数学基础(四):线性代数
人工智能·python·数学·算法·机器学习
OceanBase数据库官方博客3 小时前
OceanBase 跻身 Forrester 三大领域代表厂商,全面支撑AI场景
人工智能·oceanbase·分布式数据库
像风一样_3 小时前
机器学习-入门-决策树(1)
人工智能·决策树·机器学习
飞火流星020273 小时前
Weka通过10天的内存指标数据计算内存指标动态阈值
人工智能·机器学习·数据挖掘·weka·计算指标动态阈值·使用统计方法计算动态阈值