腾讯混元 3D 2.1 发布:首个全链路开源工业级 3D 生成大模型

腾讯混元 3D 2.1 发布:首个全链路开源工业级 3D 生成大模型

腾讯混元3D 2.1[1]开源了业界首个全链路工业级3D生成大模型,本次不仅开源了模型权重、训练代码和数据处理流程,还完整公开了核心架构设计。

通过引入PBR(基于物理的渲染)技术,显著提升了材质细节的真实性,模型在不同光照下更自然、更一致。

MagicTryOn:基于 Wan 2.1 的开源视频虚拟试穿框架

MagicTryOn[2] 是基于 Wan 2.1 的开源视频虚拟试穿框架,在时空一致性和服装内容保留方面表现出色,生成的试穿效果真实自然且稳定。

从官网演示来看,其服装贴合度和动态效果处理相当惊艳,不过目前暂时没有发布在线试用版本,想体验的话只能自己部署了。

Anthropic 揭秘:如何构建高效的多智能体研究系统

Anthropic[3] 发布了一篇深度文章,详细介绍了Anthropic 公司构建多智能体研究系统的过程,探讨了其在处理复杂研究任务中的优势、面临的挑战以及相关的工程实践和评估方法,旨在分享如何通过多智能体系统更有效地探索复杂主题的经验教训。

干货满满,值得一看!

ComfyUI 更新:原生支持 LoRA 训练功能

ComfyUI 最新版本已支持原生 LoRA 训练模块!这一更新刚刚合并到主分支,标志着 ComfyUI 在模型微调能力上的重大突破。

开发者现在可以直接在 ComfyUI 框架内完成 LoRA 训练,无需依赖外部工具。查看完整实现细节和功能说明请参考这个PR[4]。

Ming-Omni 开源多模态模型:统一处理图像文本音频视频

Ming-Omni[5] 是一款统一架构的开源多模态模型,能够无缝处理图像、文本、音频和视频等多种数据模态。

这个全能模型在各种基准测试中都表现亮眼,可以说是开源界的 GPT-4o 平替,完整项目及技术细节可以看官网。

相关推荐
hrw_embedded9 天前
腾讯龙虾QClaw-“吃虾”体验
腾讯·openclaw·qclaw
掉头发的王富贵11 天前
【2026.3.28深圳腾讯云线下活动分享】我用龙虾3分钟完成了文章的抓取,写作,发布一条龙
程序员·线下活动·腾讯
yingxiao88816 天前
沙特Savvy60亿美元收购沐瞳科技;腾讯2025年游戏收入2416亿元
腾讯·手游·游戏资讯·行业资讯·epic game·沐瞳科技
yingxiao8881 个月前
土耳其拟加强数字平台监管;腾讯或参投派拉蒙收购华纳兄弟交易
游戏·ai·腾讯·手游出海·任天堂·clash royale
TAPD敏捷研发1 个月前
TAPD联合企业微信、CNB、CodeBuddy,推出AI研发与协同办公系列分享会
人工智能·aigc·企业微信·产品经理·个人开发·腾讯·tapd
OpenBayes贝式计算2 个月前
教程上新|微信AI团队提出扩散语言模型WeDLM,相较vLLM部署AR模型实现3倍推理加速
人工智能·深度学习·腾讯
ArkAPI3 个月前
腾讯AI基础设施的系统论:从推理框架的算子融合到智能体的任务分解
人工智能·ai·google·aigc·腾讯·多模态处理·arkapi
每天回答3个问题4 个月前
UE教程|unlua知识地图
ue5·腾讯·lua5.4
试着4 个月前
【投资学习】腾讯控股(0700.HK)
大数据·人工智能·业界资讯·腾讯