infra - infra技术,学习,经验文章

山顶夕景

5 个月前

【MLLM】Qwen3.5模型✦ 基于混合结构，397B总参/17B激活，能力匹配 >1T 参数的 Qwen3-Max； ✦ 原生多模态设计，同量级下多模态任务表现优于 Qwen3-VL； ✦ 覆盖 201 种语言； ✦ 在代码生成、智能体推理与多模态理解方面表现卓越；