最新实测,新版GPT-4o生图功能太强了(文末附使用方式)

经过长达一年与人类训练师协作优化,OpenAI于美国当地时间周二发布了GPT-4o原生多模态图像生成功能,支持生成更加逼真的图像。这是 Deep Research 以来 OpenAI 最有意义的模型更新。 新模型+一句话指令,效果就超过了人类精心设计的工作流。 Al 在设计方面超过人类,已是必然。

用户只需在ChatGPT中描述图像(可指定宽高比、色号或透明度等参数),GPT-4o便能在一分钟内生成相应图像。让我们细致看一看:本次更新,突破了以往的哪些边界。

OpenAI在公告中确认,GPT-4o图像生成功能具有以下特点:

  • 精准渲染图像内文字,能够制作logo、菜单、邀请函和信息图等;
  • 精确执行复杂指令,甚至在细节丰富的构图中也能做到;
  • 基于先前的图像和文本进行扩展,确保多个交互之间的视觉一致性;
  • 支持各种艺术风格,从写实照片到插图等。

GPT-4o生成图片效果展示

除了通过GPT-4o可以在ChatGPT中直接生成图像,该模型还整合进了OpenAI的视频生成平台Sora,进一步扩展了其多模态能力。

新模型即日起将作为ChatGPT的默认图像生成引擎,向ChatGPT Free、Plus、Team及Pro用户开放,取代此前使用的DALL-E 3。企业版、教育版以及API接口也将在不久后支持该功能。

据OpenAI官方说明,GPT-4o在多个方面相较于过去的模型进行了改进:

  • 更好的文本集成:与过去那些难以生成清晰、恰当位置文字的AI模型不同,GPT-4o现在可以准确地将文字嵌入图像中;*

  • 增强的上下文理解:GPT-4o通过利用聊天历史,允许用户在互动中不断细化图像,并保持多次生成之间的一致性;*

  • 改进的多对象绑定:过去的模型在正确定位场景中的多个不同物体时存在困难,而GPT-4o现在可以一次处理多达10至20个物体;

  • 多样化风格适应:该模型可以生成或将图像转化为多种风格,支持从手绘草图到高清写实风格的转换。

让我们看看,目前4o生图可以做到的水平吧!

4o目前生图水平

1.一句话老照片上色

2.一句话修改图片

3.一句话做成鸟瞰图

4.一句话图标风格设计

5.一句话将原图改风格

6.一句话将图像转换样式

7.一句话融图创建新图像

8.一句话基于草图直接生成产品UI页面。

"你能基于这个UI创建一个高保真的产品模型吗?"。

9.一句话根据图片生成漫画

现阶段,GPT-4o取得了许多进步,但它仍然存在一些问题,其中包括:

  • 裁剪问题:像海报这样的较大图像可能会被过度裁剪;*

  • 非拉丁字符的文本准确性:某些非英语字符可能无法正确呈现;*

  • 小字体中的细节保留:小字号文本的细节可能会丢失或不够清晰;*

  • 编辑精确度:修改图像的特定部分时,可能会意外影响其他元素。

OpenAI表示,正在通过持续的模型改进积极解决这些问题。

怎么才能用上最新版 GPT-4o?

目前,可以确定的渠道是付费的 OpenAI 的 Plus、Pro 和 Team 用户。

但是海外使用有点困难,所以整理了一些其他的方式,小伙伴们可以尝试使用,接触一下4o生图的功能。

千言万语其实不如你自己实际体验一下,快来领会一下科技的魅力。

一些使用4o的方式

1、 OpenAI官网

没错,如果有能力还是直接去官网使用,体验相当nice。

就是价格稍微贵,需要20美刀,不过这个价格打包市面上OpenAI对话模型、视频、图片、语音给你使用。我觉得也合理。毕竟免费才是最贵的。

使用地址:chatgpt.com/

2、爱发电

国内大佬主要做解决GPT4o和Claude使用的公益服务网站,但是最近因为项目经常被攻击,目前采用订阅方式使用,感兴趣的可以自己去了解。本来是公益的,现在限制了一下防止攻击,需要订阅了。

公益网址我这边没去赞助,没拿到喔,想了解自己去看看吧!

使用地址:afdian.com/a/warmo

3、工作区-Salck

大佬通过OpenAI官网的API在Slack配置的一个应用。

加入他的Slack工作区就能直接使用GPT-4o、Gemini模型。而且工作区里面还有Claude3.7系列模型可以使用。目前Slack可以在电脑、手机、网页使用,可以说是很方便了。

注意,加入工作区一般需要使用国际邮箱,用微软的outlook邮箱就好了。首次加入需特殊环境(需自行准备) 。加入完进入工作区在频道@GPT4应用即可。

工作区加入链接:h5ma.cn/jxn

4、模型竞技场

进入竞技场后点击DIRCTChat,然后选择4o模型就好。

需要注意的是,模型竞技场有些时候会因为没有次数额度下架4o模型使用。你可以去试试看,如果没有的该模型选项的话,晚会再进去试试。

注:首次进入稍微卡,需要等待一会。

使用地址:h5ma.cn/lpi

5、Poe

一个海外AI模型聚合平台,提供各种各样的模型体验。市面上热门的Claude3.5、Claude3 Opus、GPT4o、Gemini基本都涵盖了。

但是限制次数,免费用户每天有3000积分,每日重置一次,对于4o模型来说,每次对话消耗200积分 ,也就是每天可以免费对话15次 。尝个鲜还是不错的。当然次数用量大,可以换号薅~

使用地址:poe.com/

6、chatshare

国内最大的镜像站之一,主要提供OpenAI和Claude的镜像服务。目前账号充足,采用自购账号和API方式接入官网服务。运行时间长,可靠稳定。

注册后需使用激活码订阅,订阅完成即可使用。具体不多说,需要的可自行了解。

使用地址:chatshare.biz

激活码获取:h5ma.cn/chatjhm

7、 Sider插件

Sider是一款浏览器插件,你可以在Edge浏览器和Chrome浏览器中安装它。

接入ChatGPT官方提供的付费稳定版API,为用户提供无需科学上网、稳定快速的服务。目前支持GPT4、Claude3、Claude3.5-16k等等,可在国内使用。

可以帮助我们进行更正语法、改写内容、扩充内容和生成广告脚本 。它支持在任何网站上使用,并提供摘要文章、解释代码等功能。

使用地址:sider.ai/invited?c=c...

8、Aichatru

俄罗斯的一个网站,可以使用4o和o1模型,但是模型应该是有次数限制的,具体多少忘记了,各位小伙伴可以自己测试。如果次数受限,可以配合大神开发的油猴脚本突破这个使用限制。

使用地址:aichatru.ru

脚本地址:greasyfork.org/zh-CN/scrip...

注意安装脚本前必须浏览器有油猴插件

没有可前往油猴插件官网安装:首页 | Tampermonkey

如果可以,希望小伙伴们点赞和收藏,这是我的更新动力!
如果可以,希望小伙伴们点赞和收藏,这是我的更新动力!

若有收获,就点个赞吧

相关推荐
星际码仔1 小时前
AutoGLM沉思,仍然没有摆脱DeepResearch产品的通病
人工智能·ai编程·chatglm (智谱)
喝拿铁写前端1 小时前
前端与 AI 结合的 10 个可能路径图谱
前端·人工智能
城电科技2 小时前
城电科技|零碳园区光伏太阳花绽放零碳绿色未来
人工智能·科技·能源
HyperAI超神经2 小时前
Stable Virtual Camera 重新定义3D内容生成,解锁图像新维度;BatteryLife助力更精准预测电池寿命
图像处理·人工智能·3d·数学推理·视频生成·对话语音生成·蛋白质突变
Chaos_Wang_2 小时前
NLP高频面试题(二十三)对抗训练的发展脉络,原理,演化路径
人工智能·自然语言处理
Yeats_Liao2 小时前
华为开源自研AI框架昇思MindSpore应用案例:基于MindSpore框架实现PWCNet光流估计
人工智能·华为
说私域3 小时前
人工智能赋能美妆零售数字化转型:基于开源AI大模型的S2B2C商城系统构建
人工智能·小程序·开源·零售
zew10409945883 小时前
基于深度学习的手势识别系统设计
人工智能·深度学习·算法·数据集·pyqt·yolov5·训练模型
weixin_478689763 小时前
pytorch与其他ai工具
人工智能·pytorch·python
豆芽8193 小时前
核函数(机器学习深度学习)
人工智能·深度学习