美团 LongCat-Flash:开源 560B MoE 模型

微软 Copilot Labs 音频表达功能:AI 语音风格自定义

微软在 Copilot Labs 上线了实验性功能「音频表达(Audio Expression)[1]」,用户通过输入提示词,可让 AI 以不同语音风格朗读文本。

目前完全免费,不过仅支持英语,佬们可以试试看。

字节开源 USO 模型:统一风格与主体驱动的生成框架

USO 模型[2]是字节开源的一项创新框架,将"风格驱动"与"主体驱动"两类图像生成任务统一整合。该模型基于 FLUX.1-dev 微调,提供了 LoRA 权重与投影模型,支持四种典型推理模式:精准主体控制、灵活风格迁移、IP-风格混合创作以及多风格融合生成。

官方还贴心地提供了在线 demo[3],佬们可以直接试玩。

腾讯 Hunyuan-MT-7B:开源 38 种语言翻译模型

Hunyuan-MT-7B[4] 是腾讯开源的翻译模型系列,包含翻译主模型 Hunyuan-MT-7B 以及业界首个开源翻译集成模型 Hunyuan-MT-Chimera-7B。

支持38种语言互译,甚至包括五种中国少数民族语言,佬们可以在混元官网在线免费用

美团 LongCat-Flash:开源 560B MoE 模型

LongCat-Flash 是美团开源的一款 560B 参数混合专家模型(MoE),采用动态计算机制,能根据上下文需求灵活激活 186 亿至 313 亿参数,平均仅需 270 亿参数即可高效完成推理。

该模型遵循 MIT 许可证开放权重,佬们也可以直接访问 LongCat AI[5]在线体验。

OpenBMB 开源 UltraRAG 2.0:YAML 配置实现多阶段 RAG 推理

OpenBMB 开源的 UltraRAG 2.0(UR-2.0)[6]是首个基于 Model Context Protocol(MCP)架构设计的轻量级 RAG 系统构建框架。

最厉害的是,你只需要编写 YAML 配置文件,就能以极低的代码量快速构建多阶段推理系统!

完整的详细使用文档可以查看官网,上手超简单,不过想要做好,不写代码是不可能的。

相关推荐
FeelTouch Labs4 小时前
开源安全治理体系建设
安全·开源
数据法师6 小时前
HandBrake:开源跨平台视频转码工具完全指南
开源·音视频
ting94520006 小时前
PandaProbe 技术全解:开源智能体工程平台的可观测性实践
人工智能·开源
Hotakus7 小时前
【Hotakus‘s Nocturne】一个暗色 VS Code 主题,低对比度配色 + 语义高亮,看代码不累。
vscode·开源·开源软件
南汁bbj7 小时前
Llama 4 开源了!1.2 万亿参数 MoE 模型本地部署 + 推理测试(附代码)
开源·llama
TT_Close9 小时前
看懂 VSCode 发布中心后,下一步该把 App 发版交给 CLI 了
npm·开源·app
小小测试开发9 小时前
EasyOCR用法全攻略:Python开源OCR工具快速上手,图文识别零门槛
python·开源·ocr
赵鑫亿9 小时前
ClawPanel — 开源 OpenClaw 智能管理面板,20+ 通道接入 / 多模型配置 / Docker 一键部署
docker·容器·开源
RuoyiOffice9 小时前
2026 年开源 BPM/工作流引擎大盘点:Flowable vs Camunda vs Activiti vs Turbo——谁才是企业级首选?
java·spring boot·后端·开源·流程图·ruoyi·anti-design-vue
不愿透露姓名的大鹏9 小时前
2026全网最全AI Skill开源合集|从爆火角色蒸馏到全场景生产级技能开箱即用
人工智能·开源