哔哩哔哩开源 IndexTTS-2.0:新一代零样本语音合成模型

Qwen3-ASR-Flash:高精度多语言语音识别模型

Qwen3-ASR-Flash[1] 是基于 Qwen3 推出的高精度多语言语音识别模型,支持 11 种语言及其多种口音,具备自动语种检测与非人声过滤功能。

目前该模型暂未开源(有点小遗憾),但已上线阿里云百炼平台 API,佬们也可以在 Hugging Face Space 上在线体验[2]。

哔哩哔哩开源 IndexTTS-2.0:新一代零样本语音合成模型

IndexTTS-2.0[3] 是哔哩哔哩语音团队开源的新一代零样本语音合成模型,基于 55K 小时中英双语语音和 135 小时情感数据训练,实现了对语音时长和情感的精准控制。

目前 SDK 和模型都已开放,有需要的佬可以试试看!

即梦 AI 推出 Seedream 4.0 图像生成模型

即梦 AI 平台官网[4]的新一代图像生成模型 Seedream 4.0 已逐步向所有用户推送,中国版 Nano Banana 来了。

不过官方尚未发文正式发布,但登录后即可直接体验,一次生成消耗 1 积分。

MCP Registry 发布:开源标准化 MCP 服务器分发与发现

Model Context Protocol(MCP)Registry 预览版[5]正式发布,这个项目可以理解为 Node.js 的 npm 或者 Python 的 PyPI 的 MCP 版本。

它旨在标准化 MCP 服务器的分发与发现流程,完全开源并支持下游构建公共或私有的子注册表。目前只能通过接口和命令行工具来发布和获取,感觉可以开始抢占几个好名字了!

Vercel 开源 Vibe Coding 平台:集成 AI SDK 的完整开发生态

Vibe Coding Platform[6] 是 Vercel 发布并开源的基于其公司生态系统(包含 AI SDK、Gateway 和 Sandbox )的编码平台。

有做类似业务的佬们可以好好研究下源码[7],学习学习设计思路啥的。

相关推荐
猫头虎14 小时前
如何在浏览器里体验 Windows在线模拟器:2026最新在线windows模拟器资源合集与技术揭秘
运维·网络·windows·系统架构·开源·运维开发·开源软件
修己xj16 小时前
从“死了么”到“活着记”:用Gmeek在数字世界留下思想印记
开源
鼎道开发者联盟17 小时前
2025中国AI开源生态报告发布,鼎道智联助力产业高质量发展
人工智能·开源·gui
大厂技术总监下海17 小时前
Rust的“一发逆转弹”:Dioxus 如何用一套代码横扫 Web、桌面、移动与后端?
前端·rust·开源
DisonTangor21 小时前
阿里Qwen开源Qwen3-VL-Embedding 和 Qwen3-VL-Reranker
人工智能·搜索引擎·开源·aigc·embedding
搬砖的kk1 天前
Cordova 适配鸿蒙系统(OpenHarmony) 全解析:技术方案、环境搭建与实战开发
华为·开源·harmonyos
猫头虎1 天前
2026最新|GitHub 启用双因素身份验证 2FA 教程:TOTP.app 一键生成动态验证码(新手小白图文实操)
git·开源·gitlab·github·开源软件·开源协议·gitcode
REDcker1 天前
Mach3、Mach4与开源数控软件对比分析
开源·加工·数控·机床·mach3·mach4·数控加工
java_logo1 天前
Dify 开源 LLM 应用开发平台企业级 Docker Compose 部署手册
docker·容器·开源·dify部署·dify部署文档·dify部署方案·dify部署教程
_小苔藓_1 天前
混合Token与LoRA结合Qwen3-VL高效微调(代码开源)
深度学习·开源·大模型·微调·多模态