阿里 Qwen-Image:20B 参数开源文生图模型,文本渲染能力突出

阿里 Qwen-Image:20B 参数开源文生图模型,文本渲染能力突出

阿里巴巴通义千问团队发布了其首个图像生成基础模型 Qwen-Image。该模型是一个拥有 20B 参数的 MMDiT 模型,基于 Apache 2.0 许可证开源。

官方号称其特别擅长文本渲染和复杂场景生成。完整介绍可以查看官方博客[1]。

腾讯混元开源 0.5B-7B 轻量级大模型系列

腾讯混元团队[2]一次性开源了四款参数规模从 0.5B 到 7B 的小尺寸大语言模型。

这些模型专门针对消费级 GPU、边缘计算设备(包括智能汽车、智能家居)以及移动终端(手机和 PC)等低功耗场景优化设计。

XAI 发布 Grok Imagine 4:支持文生图/视频及 NSFW 内容生成

马斯克旗下 XAI[3] 推出的 Grok Imagine 4 现已正式发布。

该功能支持文生图,生成速度极快,就跟刷小红书似的。还支持图生视频,不过效果一般,但生成效率同样出色,最 6 的是原生支持 NSFW 内容生成。

目前已经向所有 Premium 订阅用户开放,需将客户端更新至最新版本才能体验。

相关推荐
Albert_Lsk6 小时前
【2025/08/04】GitHub 今日热门项目
人工智能·开源·github·开源协议
爱吃香蕉的阿豪6 小时前
乐思 AI 智能识别平台(基于 YOLO,.NET+Vue3 开发)开源指南
人工智能·yolo·开源·aigc·.netcore
NocoBase8 小时前
8 款最适合搭建 CRM 的零代码工具推荐(开源 & SaaS)
低代码·开源·saas
倔强的石头1069 小时前
[源力觉醒 创作者计划]_文心4.5开源测评:国产大模型的技术突破与多维度能力解析
百度·开源·文心一言·文心大模型
陈哥聊测试10 小时前
Coze开源了!意味着什么
人工智能·开源·资讯
运维开发王义杰11 小时前
Ethereum:拥抱开源,OpenZeppelin 未来的两大基石 Relayers 与 Monitor
开源·web3·区块链·智能合约
素界UI设计12 小时前
开源网页生态掘金:从Bootstrap二次开发到行业专属组件库的技术变现
前端·开源·bootstrap
kakaZhou71913 小时前
日志系统之Grafana Loki
后端·开源
BUG收容所所长13 小时前
如何用React打造一个完整的移动端问卷调查应用?
前端·react.js·开源