阿里 Qwen-Image:20B 参数开源文生图模型,文本渲染能力突出

阿里 Qwen-Image:20B 参数开源文生图模型,文本渲染能力突出

阿里巴巴通义千问团队发布了其首个图像生成基础模型 Qwen-Image。该模型是一个拥有 20B 参数的 MMDiT 模型,基于 Apache 2.0 许可证开源。

官方号称其特别擅长文本渲染和复杂场景生成。完整介绍可以查看官方博客[1]。

腾讯混元开源 0.5B-7B 轻量级大模型系列

腾讯混元团队[2]一次性开源了四款参数规模从 0.5B 到 7B 的小尺寸大语言模型。

这些模型专门针对消费级 GPU、边缘计算设备(包括智能汽车、智能家居)以及移动终端(手机和 PC)等低功耗场景优化设计。

XAI 发布 Grok Imagine 4:支持文生图/视频及 NSFW 内容生成

马斯克旗下 XAI[3] 推出的 Grok Imagine 4 现已正式发布。

该功能支持文生图,生成速度极快,就跟刷小红书似的。还支持图生视频,不过效果一般,但生成效率同样出色,最 6 的是原生支持 NSFW 内容生成。

目前已经向所有 Premium 订阅用户开放,需将客户端更新至最新版本才能体验。

相关推荐
铁蛋AI编程实战3 小时前
OpenClaw+Kimi K2.5开源AI助手零门槛部署教程:本地私有化+远程控制+办公自动化全实操
人工智能·开源
万岳科技系统开发3 小时前
多城市运营场景下,开源跑腿系统源码如何做分站管理
开源
Goway_Hui3 小时前
【开源鸿蒙跨平台开发--KuiklyUI--07】详解:如何使用 Trae 开发 Kuikly-OH 跨端应用
开源·openharmony·kuikly
开源能源管理系统4 小时前
MyEMS开源能源管理系统:零碳工厂建设的技术支撑与实践路径
开源·能源·能源管理系统·零碳工厂
yumgpkpm4 小时前
2026软件:白嫖,开源,外包,招标,晚进场(2025年下半年),数科,AI...中国的企业软件产业出路
大数据·人工智能·hadoop·算法·kafka·开源·cloudera
冬奇Lab5 小时前
一天一个开源项目(第12篇):SoulX-Podcast - 多轮对话式播客生成,让AI语音更自然真实
人工智能·开源
寻道码路5 小时前
【GitHub开源AI精选】WhisperX:70倍实时语音转录、革命性词级时间戳与多说话人分离技术
人工智能·开源·github
血色橄榄枝6 小时前
13-14 底部选项卡 flutter on openHarmony
flutter·开源·鸿蒙
CoderJia程序员甲8 小时前
GitHub 热榜项目 - 日榜(2026-02-04)
开源·大模型·llm·github·ai教程
向上的车轮10 小时前
开源版 Coze: 创建工作流(Workflow)
开源