经过长达一年与人类训练师协作优化,OpenAI于美国当地时间周二发布了GPT-4o原生多模态图像生成功能,支持生成更加逼真的图像。这是 Deep Research 以来 OpenAI 最有意义的模型更新。 新模型+一句话指令,效果就超过了人类精心设计的工作流。 Al 在设计方面超过人类,已是必然。
用户只需在ChatGPT中描述图像(可指定宽高比、色号或透明度等参数),GPT-4o便能在一分钟内生成相应图像。让我们细致看一看:本次更新,突破了以往的哪些边界。
OpenAI在公告中确认,GPT-4o图像生成功能具有以下特点:
- 精准渲染图像内文字,能够制作logo、菜单、邀请函和信息图等;
- 精确执行复杂指令,甚至在细节丰富的构图中也能做到;
- 基于先前的图像和文本进行扩展,确保多个交互之间的视觉一致性;
- 支持各种艺术风格,从写实照片到插图等。
GPT-4o生成图片效果展示
除了通过GPT-4o可以在ChatGPT中直接生成图像,该模型还整合进了OpenAI的视频生成平台Sora,进一步扩展了其多模态能力。
新模型即日起将作为ChatGPT的默认图像生成引擎,向ChatGPT Free、Plus、Team及Pro用户开放,取代此前使用的DALL-E 3。企业版、教育版以及API接口也将在不久后支持该功能。
据OpenAI官方说明,GPT-4o在多个方面相较于过去的模型进行了改进:
-
更好的文本集成:与过去那些难以生成清晰、恰当位置文字的AI模型不同,GPT-4o现在可以准确地将文字嵌入图像中;*
-
增强的上下文理解:GPT-4o通过利用聊天历史,允许用户在互动中不断细化图像,并保持多次生成之间的一致性;*
-
改进的多对象绑定:过去的模型在正确定位场景中的多个不同物体时存在困难,而GPT-4o现在可以一次处理多达10至20个物体;
-
多样化风格适应:该模型可以生成或将图像转化为多种风格,支持从手绘草图到高清写实风格的转换。
让我们看看,目前4o生图可以做到的水平吧!
4o目前生图水平
1.一句话老照片上色
2.一句话修改图片
3.一句话做成鸟瞰图
4.一句话图标风格设计
5.一句话将原图改风格
6.一句话将图像转换样式
7.一句话融图创建新图像
8.一句话基于草图直接生成产品UI页面。
"你能基于这个UI创建一个高保真的产品模型吗?"。
9.一句话根据图片生成漫画
现阶段,GPT-4o取得了许多进步,但它仍然存在一些问题,其中包括:
-
裁剪问题:像海报这样的较大图像可能会被过度裁剪;*
-
非拉丁字符的文本准确性:某些非英语字符可能无法正确呈现;*
-
小字体中的细节保留:小字号文本的细节可能会丢失或不够清晰;*
-
编辑精确度:修改图像的特定部分时,可能会意外影响其他元素。
OpenAI表示,正在通过持续的模型改进积极解决这些问题。
怎么才能用上最新版 GPT-4o?
目前,可以确定的渠道是付费的 OpenAI 的 Plus、Pro 和 Team 用户。
但是海外使用有点困难,所以整理了一些其他的方式,小伙伴们可以尝试使用,接触一下4o生图的功能。
千言万语其实不如你自己实际体验一下,快来领会一下科技的魅力。
一些使用4o的方式
1、 OpenAI官网
没错,如果有能力还是直接去官网使用,体验相当nice。
就是价格稍微贵,需要20美刀,不过这个价格打包市面上OpenAI对话模型、视频、图片、语音给你使用。我觉得也合理。毕竟免费才是最贵的。
使用地址:chatgpt.com/
2、爱发电
国内大佬主要做解决GPT4o和Claude使用的公益服务网站,但是最近因为项目经常被攻击,目前采用订阅方式使用,感兴趣的可以自己去了解。本来是公益的,现在限制了一下防止攻击,需要订阅了。
公益网址我这边没去赞助,没拿到喔,想了解自己去看看吧!
使用地址:afdian.com/a/warmo
3、工作区-Salck
大佬通过OpenAI官网的API在Slack配置的一个应用。
加入他的Slack工作区就能直接使用GPT-4o、Gemini模型。而且工作区里面还有Claude3.7系列模型可以使用。目前Slack可以在电脑、手机、网页使用,可以说是很方便了。
注意,加入工作区一般需要使用国际邮箱,用微软的outlook邮箱就好了。首次加入需特殊环境(需自行准备) 。加入完进入工作区在频道@GPT4应用即可。
工作区加入链接:h5ma.cn/jxn
4、模型竞技场
进入竞技场后点击DIRCTChat,然后选择4o模型就好。
需要注意的是,模型竞技场有些时候会因为没有次数额度下架4o模型使用。你可以去试试看,如果没有的该模型选项的话,晚会再进去试试。
注:首次进入稍微卡,需要等待一会。
使用地址:h5ma.cn/lpi
5、Poe
一个海外AI模型聚合平台,提供各种各样的模型体验。市面上热门的Claude3.5、Claude3 Opus、GPT4o、Gemini基本都涵盖了。
但是限制次数,免费用户每天有3000积分,每日重置一次,对于4o模型来说,每次对话消耗200积分 ,也就是每天可以免费对话15次 。尝个鲜还是不错的。当然次数用量大,可以换号薅~
使用地址:poe.com/
6、chatshare
国内最大的镜像站之一,主要提供OpenAI和Claude的镜像服务。目前账号充足,采用自购账号和API方式接入官网服务。运行时间长,可靠稳定。
注册后需使用激活码订阅,订阅完成即可使用。具体不多说,需要的可自行了解。
使用地址:chatshare.biz
激活码获取:h5ma.cn/chatjhm
7、 Sider插件
Sider是一款浏览器插件,你可以在Edge浏览器和Chrome浏览器中安装它。
接入ChatGPT官方提供的付费稳定版API,为用户提供无需科学上网、稳定快速的服务。目前支持GPT4、Claude3、Claude3.5-16k等等,可在国内使用。
可以帮助我们进行更正语法、改写内容、扩充内容和生成广告脚本 。它支持在任何网站上使用,并提供摘要文章、解释代码等功能。
8、Aichatru
俄罗斯的一个网站,可以使用4o和o1模型,但是模型应该是有次数限制的,具体多少忘记了,各位小伙伴可以自己测试。如果次数受限,可以配合大神开发的油猴脚本突破这个使用限制。
使用地址:aichatru.ru
脚本地址:greasyfork.org/zh-CN/scrip...
注意安装脚本前必须浏览器有油猴插件 。
没有可前往油猴插件官网安装:首页 | Tampermonkey
如果可以,希望小伙伴们点赞和收藏,这是我的更新动力!
如果可以,希望小伙伴们点赞和收藏,这是我的更新动力!
若有收获,就点个赞吧