阿里 Qwen-Image：20B 参数开源文生图模型，文本渲染能力突出

三花AI2025-08-05 17:48

阿里巴巴通义千问团队发布了其首个图像生成基础模型 Qwen-Image。该模型是一个拥有 20B 参数的 MMDiT 模型，基于 Apache 2.0 许可证开源。

官方号称其特别擅长文本渲染和复杂场景生成。完整介绍可以查看官方博客 $1$ 。

腾讯混元团队 $2$ 一次性开源了四款参数规模从 0.5B 到 7B 的小尺寸大语言模型。

这些模型专门针对消费级 GPU、边缘计算设备（包括智能汽车、智能家居）以及移动终端（手机和 PC）等低功耗场景优化设计。

马斯克旗下 XAI $3$ 推出的 Grok Imagine 4 现已正式发布。

该功能支持文生图，生成速度极快，就跟刷小红书似的。还支持图生视频，不过效果一般，但生成效率同样出色，最 6 的是原生支持 NSFW 内容生成。

目前已经向所有 Premium 订阅用户开放，需将客户端更新至最新版本才能体验。