哔哩哔哩开源 IndexTTS-2.0:新一代零样本语音合成模型

Qwen3-ASR-Flash:高精度多语言语音识别模型

Qwen3-ASR-Flash[1] 是基于 Qwen3 推出的高精度多语言语音识别模型,支持 11 种语言及其多种口音,具备自动语种检测与非人声过滤功能。

目前该模型暂未开源(有点小遗憾),但已上线阿里云百炼平台 API,佬们也可以在 Hugging Face Space 上在线体验[2]。

哔哩哔哩开源 IndexTTS-2.0:新一代零样本语音合成模型

IndexTTS-2.0[3] 是哔哩哔哩语音团队开源的新一代零样本语音合成模型,基于 55K 小时中英双语语音和 135 小时情感数据训练,实现了对语音时长和情感的精准控制。

目前 SDK 和模型都已开放,有需要的佬可以试试看!

即梦 AI 推出 Seedream 4.0 图像生成模型

即梦 AI 平台官网[4]的新一代图像生成模型 Seedream 4.0 已逐步向所有用户推送,中国版 Nano Banana 来了。

不过官方尚未发文正式发布,但登录后即可直接体验,一次生成消耗 1 积分。

MCP Registry 发布:开源标准化 MCP 服务器分发与发现

Model Context Protocol(MCP)Registry 预览版[5]正式发布,这个项目可以理解为 Node.js 的 npm 或者 Python 的 PyPI 的 MCP 版本。

它旨在标准化 MCP 服务器的分发与发现流程,完全开源并支持下游构建公共或私有的子注册表。目前只能通过接口和命令行工具来发布和获取,感觉可以开始抢占几个好名字了!

Vercel 开源 Vibe Coding 平台:集成 AI SDK 的完整开发生态

Vibe Coding Platform[6] 是 Vercel 发布并开源的基于其公司生态系统(包含 AI SDK、Gateway 和 Sandbox )的编码平台。

有做类似业务的佬们可以好好研究下源码[7],学习学习设计思路啥的。

相关推荐
迷藏4942 小时前
**发散创新:基于Rust实现的开源合规权限管理框架设计与实践**在现代软件架构中,**权限控制(RBAC)** 已成为保障
java·开发语言·python·rust·开源
AI成长日志4 小时前
【GitHub开源项目专栏】AI推理优化框架深度解析(上):vLLM架构设计与核心实现
人工智能·开源·github
CV-deeplearning4 小时前
【开源】字节跳动开源 DeerFlow 2.0:一站式 SuperAgent 开发框架,GitHub 星标 5.9 万!
开源·github·deerflow·deerflow 2.0·superagent
十六年开源服务商4 小时前
2026招聘网站建设方案策划全攻略
开源
aosky4 小时前
**开源音乐播放器推荐:LX Music 桌面版简析**
开源·音乐播放器
2501_948114245 小时前
DeepSeek V4 全面实测:万亿参数开源模型的工程落地与成本推演
人工智能·ai·开源
RestCloud5 小时前
2026年企业级ETL工具选型指南:从开源DataX到商业化ETLCloud的演进
数据仓库·开源·etl·datax·数据处理·数据集成·数据传输
GitCode官方5 小时前
智谱 GLM-5.1 正式开源并上线 AtomGit AI!
人工智能·开源
REDcker6 小时前
Jenkins 开源 CI/CD 平台概览与版本演进
ci/cd·开源·jenkins
世人万千丶6 小时前
Flutter 框架跨平台鸿蒙开发 - 宠物语言翻译器应用
学习·flutter·华为·开源·harmonyos·鸿蒙