GPT-4o 多模态图像生成功能解析 | 2025 年第 13 周草梅周报

本文在 草梅友仁的博客 发布和更新,并在多个平台同步发布。如有更新,以博客上的版本为准。您也可以通过文末的 原文链接 查看最新版本。

前言

欢迎来到草梅周报!这是一个由草梅友仁基于 AI 整理的周报,旨在为您提供最新的博客更新、GitHub 动态、个人动态和其他周刊文章推荐等内容。


AI 动态

近期最火爆的 AI 相关内容毫无疑问就是 OpenAI 最新发布的 GPT-4o 的多模态图像生成功能。

这一次的 GPT-4o 多模态图像生成功能相较于以往的 Stable Diffusion 模型的随机抽卡式图片生成有了极大改进,借助 GPT-4o 自身的大模型能力,GPT-4o 可以精确的理解用户的意图,从而生成用户想要的图片。

《OpenAI GPT-4o 推出原生图像生成功能,这次升级有哪些看点? - WouldYouKindly 的回答 - 知乎》 为例,通过一张模糊的原图,就能够直接生成多种风格的图片。

例如哆啦 A 梦风格。

当然了,笔者也亲自尝试了一下。

先是随便生成了一张图片。

然后让它改图。

可见,它精确的理解了我的想法,甚至理解了"黑话",例如"抽卡"、"出金"等,还加了我没有提到的"NEW!"和 5 星。

当然,我这里只是用免费账号试用了一下,目前 ChatGPT 官网对免费用户的限制还是比较大的,基本上十分钟才能生成一张。如有需要,可以开通 20 美元一月的 plus 账号使用,额度会更高。

正如当初 GPT-3.5 对写作和编程的降维打击,现在 GPT-4o 也正式形成了对绘画、平面设计、图片生成等的降维打击,比当初 Stable Diffusion 的打击还要严重的多。

如果说当初 Stable Diffusion 生成的图片还存在的浓浓的 AI 风,那么现在 GPT-4o 生成的图片已经到了可以以假乱真的地步了,除了部分细节,已经很难分辨十分由 AI 生成了。

同时,这一次 GPT-4o 的更新也告诉我们一个道理:有时候,AI 大模型的一次更新,就能干翻无数人引以为豪的技能。

在可预见的未来里,这样的事情还会越来越多。

因此,在 AI 时代已经来临的当下,每一个人都不能独善其身。

只有继续学习使用 AI,才能在接下来的 AI 时代,保持自己的竞争力。

开源项目推荐

comfyanonymous/ComfyUI

一个强大的和模块化的可视化 AI 引擎和应用程序,通过管道来稳定的生成 AI 图片。

GitHub Release

wechat-official-helper

v1.0.3 - 2025-03-30 00:59:48

摘要: 版本 1.0.3 更新摘要

Bug 修复:

  • 优化 OAuth 登录页面,提升用户体验和界面美观度。

最新 GitHub 加星仓库

  • CaoMeiYouRen starred ComfyUI - 2025-03-30 19:43:23 这是一个功能强大且模块化的扩散模型图形用户界面(GUI)、应用程序接口(API)和后端系统,采用图形/节点界面设计。主要编程语言为 Python。该项目在 GitHub 上获得了 72,786 个星标。
  • CaoMeiYouRen starred bili-shadowreplay - 2025-03-28 15:17:30 Bilibili 直播实时切片工具是一个用 Rust 语言开发的项目,主要用于实时切片 Bilibili 直播内容。该项目在 GitHub 上获得了 223 个星标。
  • CaoMeiYouRen starred docxy - 2025-03-28 14:54:32 Docker Hub 代理服务是一个使用 Rust 语言开发的项目,目前在 GitHub 上获得了 188 个星标。该项目的主要功能是为 Docker Hub 提供代理服务,帮助用户更高效地管理和使用 Docker 镜像。
  • CaoMeiYouRen starred wxlogin - 2025-03-28 14:51:44 该项目是一个基于微信公众号(个人未认证)的验证码登录服务,主要使用 TypeScript 语言开发。该项目在 GitHub 上获得了 196 个星标,表明其受到了一定的关注和认可。该服务旨在通过微信公众号实现用户登录时的验证码功能,适用于个人开发者或小型项目。

其他博客或周刊推荐

阮一峰的网络日志

HelloGitHub 月刊

老胡的周刊

阿猫的博客

潮流周刊

总结

本周的更新和动态如上所示。感谢您的阅读! 您可以通过以下方式订阅草梅周报的更新:

往期回顾

本文作者:草梅友仁

本文地址:blog.cmyr.ltd/archives/20...

版权声明:本文采用 CC BY-NC-SA 4.0 协议 进行分发,转载请注明出处!

相关推荐
用户40993225021219 小时前
Vue 3中reactive函数如何通过Proxy实现响应式?使用时要避开哪些误区?
前端·ai编程·trae
未来智慧谷20 小时前
OpenAI押注的NEO人形机器人:技术拆解与消费级人形机器人落地启示
机器人·openai·人形机器人neo
Mintopia21 小时前
🤖 通用人工智能(AGI)离 Web 应用还有多远?
前端·javascript·aigc
CoderJia程序员甲1 天前
GitHub 热榜项目 - 日榜(2025-11-04)
开源·github·ai编程·github热榜
墨风如雪1 天前
360 FG-CLIP2:让AI拥有“火眼金睛”,刷新全球图文理解上限
aigc
AI炼金师1 天前
Claude Code Web:它是什么以及如何使用
ai编程·极限编程·vibecoding
nihao5611 天前
Figma-Context-MCP 帮助前端快速生成页面
前端·ai编程·figma
云起SAAS1 天前
黄历万年历择吉日抖音快手微信小程序看广告流量主开源
微信小程序·小程序·ai编程·看广告变现轻·黄历万年历择吉日
Moment1 天前
Cursor 2.0 支持模型并发,我用国产 RWKV 模型实现了一模一样的效果 🤩🤩🤩
前端·后端·openai
用户5191495848451 天前
原型污染攻击工具揭秘:Prototype Pollution Gadgets Finder
人工智能·aigc