腾讯混元 3D 2.1 发布：首个全链路开源工业级 3D 生成大模型

三花AI2025-06-16 11:39

腾讯混元3D 2.1 $1$ 开源了业界首个全链路工业级3D生成大模型，本次不仅开源了模型权重、训练代码和数据处理流程，还完整公开了核心架构设计。

通过引入PBR（基于物理的渲染）技术，显著提升了材质细节的真实性，模型在不同光照下更自然、更一致。

MagicTryOn $2$ 是基于 Wan 2.1 的开源视频虚拟试穿框架，在时空一致性和服装内容保留方面表现出色，生成的试穿效果真实自然且稳定。

从官网演示来看，其服装贴合度和动态效果处理相当惊艳，不过目前暂时没有发布在线试用版本，想体验的话只能自己部署了。

Anthropic $3$ 发布了一篇深度文章，详细介绍了Anthropic 公司构建多智能体研究系统的过程，探讨了其在处理复杂研究任务中的优势、面临的挑战以及相关的工程实践和评估方法，旨在分享如何通过多智能体系统更有效地探索复杂主题的经验教训。

干货满满，值得一看！

ComfyUI 最新版本已支持原生 LoRA 训练模块！这一更新刚刚合并到主分支，标志着 ComfyUI 在模型微调能力上的重大突破。

开发者现在可以直接在 ComfyUI 框架内完成 LoRA 训练，无需依赖外部工具。查看完整实现细节和功能说明请参考这个PR $4$ 。

Ming-Omni $5$ 是一款统一架构的开源多模态模型，能够无缝处理图像、文本、音频和视频等多种数据模态。

这个全能模型在各种基准测试中都表现亮眼，可以说是开源界的 GPT-4o 平替，完整项目及技术细节可以看官网。