阿里 Qwen-Image:20B 参数开源文生图模型,文本渲染能力突出

阿里 Qwen-Image:20B 参数开源文生图模型,文本渲染能力突出

阿里巴巴通义千问团队发布了其首个图像生成基础模型 Qwen-Image。该模型是一个拥有 20B 参数的 MMDiT 模型,基于 Apache 2.0 许可证开源。

官方号称其特别擅长文本渲染和复杂场景生成。完整介绍可以查看官方博客[1]。

腾讯混元开源 0.5B-7B 轻量级大模型系列

腾讯混元团队[2]一次性开源了四款参数规模从 0.5B 到 7B 的小尺寸大语言模型。

这些模型专门针对消费级 GPU、边缘计算设备(包括智能汽车、智能家居)以及移动终端(手机和 PC)等低功耗场景优化设计。

XAI 发布 Grok Imagine 4:支持文生图/视频及 NSFW 内容生成

马斯克旗下 XAI[3] 推出的 Grok Imagine 4 现已正式发布。

该功能支持文生图,生成速度极快,就跟刷小红书似的。还支持图生视频,不过效果一般,但生成效率同样出色,最 6 的是原生支持 NSFW 内容生成。

目前已经向所有 Premium 订阅用户开放,需将客户端更新至最新版本才能体验。

相关推荐
ApacheSeaTunnel16 小时前
SeaTunnel + AI:一句“我要做什么”,能不能直接变成一份能跑的配置?
大数据·ai·开源·数据集成·seatunnel·数据同步
kefon16 小时前
从零搭一个 AI Agent:我选了最省钱的方案
开源·github·agent
M ? A16 小时前
VuReact 1.6.2 发布,新一代 Vue 3 转 React 编译工具
前端·javascript·vue.js·react.js·面试·开源·vureact
zhijiewong16 小时前
开源 AI 代码安全智能体 mythos-agent:设计、实现、以及坑
开源
Robot_Nav16 小时前
OpenVLA: 开源视觉-语言-动作模型文献解读
开源·openvla
嵌入式小企鹅16 小时前
Kimi K2.6开源对标GPT-5.4、英飞凌AURIX拥抱RISC-V、工信部定调太空算力
人工智能·学习·开源·嵌入式·模型·半导体·昇腾
数字供应链安全产品选型17 小时前
2026 年 4 月深度复盘:Hermes Agent 开源潮下,悬镜灵境 AIDR 如何构建智能体安全 “全链路护城河”
安全·开源
fTiN CAPA17 小时前
开源模型应用落地-FastAPI-助力模型交互-进阶篇-中间件(四)
开源·交互·fastapi
lKWO OMET17 小时前
开源模型应用落地-工具使用篇-Spring AI-高阶用法(九)
人工智能·spring·开源
芯智工坊17 小时前
AixProbe开源AI远程调试器:第1章 硬件讲解
人工智能·开源·aixprobe