谷歌「香蕉」手写满分卷,Karpathy 玩上瘾!ChatGPT 跪验沉默

「【新智元导读】谷歌 Nano Banana Pro 出世,又成为一个现象级爆款。这届网友彻底玩疯:手写试卷全对、秒出神级信息图、电影级分镜、跨世纪变装.....」

上周,谷歌用两场发布,强势宣告王者归来!

Gemini 3 Pro+Nano Banana Pro 双核弹连发,巨大的余波至今让 AI 圈没有缓过来。

谷歌此举,完成了一个精准又漂亮的战略绝杀。

PyTorch 之父 Soumith Chintala 高度评价道,「Gemini 3 似乎比任何时刻,更接近 GPT-4」。

就连 Scalesforce CEO Marc Benioff,直接从 ChatGPT 转战 Gemini 3 了。

不仅如此,Nano Banana Pro 的超强生图实力,更是让业界大佬连连惊掉下巴。

硅谷八巨头同框,超逼真人物生成真假难辨;一个坐标出图,推理超精准;一键生成电影花絮....

左右滑动查看

如今,Nano Banana Pro 各种开脑洞玩法,彻底失控。

「一张试卷,交出完美手写答卷」

就连 AI 大神 Karpathy,也无法抗拒 Nano Banana Pro 的魅力。

今天,Karpathy 分别将一张物理和一张化学试卷,扔给了 Nano Banana Pro。

如下所示,左边是上传的试卷,右边是 AI 直出的答案。

令人惊艳的是,Nano Banana Pro 解答过程中,还会做一些涂鸦、图表等,堪称一份完美手写稿。

ChatGPT 核查答案全部正确,除了一些拼写小错误

Karpathy 惊叹道,这类似通过文本与 LLM 对话的感觉,就像是在 DOS 终端打字聊天一样。

图像用户界面是一个「智能画布」。

还有网友将一道数学题拍照上传,Nano Banana Pro 竟能以同样的手写体输出答案。

类似的案例,比比皆是。

别看一张简单的 AI 生图,这背后用上了 Nano Banana Pro 洪荒之力。

其中最核心的是,强大的逻辑推理、超强的文本渲染,以及多模态融合,才实现了看图理解------解题------手写输出的完整流程。

谷歌「香蕉」的效果,已经好到让网友难以相信自己的眼睛。

「别再做 PPT 了,一张图搞定」

在生成信息超丰富的图表上,Nano Banana Pro 更是做到了一流。

想要做一份汉堡,Nano Banana Pro 直出组装教程。

Karpathy 还让它设计了一份每周健身计划,不仅细致还具有可实践性。

有趣的是,Karpathy 还特意让 Nano Banana Pro 把计划设计得更「睾酮爆表」,没想到,AI 直接在周二计划中直接上强度了。

网友 Kris Kashtanova 将一个铺满字菜单上传后,就得到了每道菜配着相应图片的可视化菜单。

Karpathy 点评道,「纯神经网络自动生成」。

研究员 Anders Sandberg 上传论文内容后,Nano Banana Pro 还可以配上相应的插图。

还有著名地标信息图,埃菲尔铁塔、悉尼歌剧院、自由女神像、罗马斗兽场,

一张图诠释「热狗是三明治吗」?

「一键生成「电影级」分镜」

分镜,对 AI 生图要求非常高。

它需考验「叙事理解 + 角色一致性 + 连贯性」的综合表现,即便如此,Nano Banana Pro 也能 hold 住。

网友 James Yeung 做了一个 1984 的电影分镜故事版。

上下滑动查看

沃顿商学院教授 Ethan Mollick 实测,让 Nano Banana Pro 将「尤利西斯」诗作绘成漫画。

左右滑动查看

网友 The Artist's Journey 上传了著作第一页,便得到了电影版的序列画面。

上下滑动查看

就连电影制作人,也被惊艳到了。

左右滑动查看

更多网友惊艳 demo 一览。

「重制版幕后花絮」

更疯狂的是,Nano Banana Pro 还可以直出真人重制版幕后花絮。

这是专为《堡垒之夜》粉丝们出的一期。

左右滑动查看

还有一些经典名场面、表情包、电影等,全部被网友搞出了精彩花絮。

左右滑动查看

「16 宫格「时空摄影」,横穿 150 年」

今天,Nano Banana Pro 又贡献了一个新玩法------16 宫格。

基底提示框架:

Make a 4×4 grid starting with the 1880s. In each section, I should appear styled according to that decade (clothing, hairstyle, facial hair, accessories). Use colors, background, & film style accordingly.

从 1880 年代开始,Nano Banana Pro 连续生成每隔十年人物的形象。

网友 Blaine Brown 上传了一张照片后,Nano Banana Pro 生动刻画了不同年代,人物服装打扮的特点。

一张图看遍从 1880s 到赛博年代,女性的发型和穿着的变化。

还有表情包、动物、漫威人物等恶搞系列。

左右滑动查看

还有艺术系列,美得让人惊叹。

各路大神还解锁了哪些「鬼才」玩法?欢迎评论区分享你的独门秘籍。

参考资料:

x.com/karpathy/st...

x.com/jamesyeung1...

相关推荐
littleM2 分钟前
OpenClaw vs HermesAgent 对比分析系列
人工智能·架构·ai编程
AI医影跨模态组学4 分钟前
Research(IF=10.9)南方医科大学珠江医院汪洋教授等团队:深度学习在脊柱MRI诊断中的应用:AI辅助与人工的多中心对比研究
人工智能·深度学习·论文·医学影像·影像组学
Zldaisy3d9 分钟前
上交大特材所 l 增材制造多层级功能结构综述
人工智能
缝艺智研社12 分钟前
誉财 YC - 16 POLO 衫智能自动钉扣机:POLO 衫钉扣新变革
人工智能·新人首发·自动化缝纫机·线上模板机·无人自动化产线
带电的小王14 分钟前
【动手学深度学习】8.4. 循环神经网络
人工智能·pytorch·rnn·深度学习
yigan_Eins14 分钟前
Transformer|残差连接的技术演进:从CNN到ResNet
人工智能·深度学习·cnn·transformer
道可云15 分钟前
道可云人工智能&OPC每日资讯|《广东省加快推进人工智能全域全时全行业高水平应用行动方案》发布
人工智能
0xR3lativ1ty18 分钟前
每周AI新工具速览:Kiln与OpenRA-RL登场
人工智能·ai
精益数智工坊19 分钟前
拆解制造业仓库物料管理流程:如何通过标准化仓库物料管理流程解决账实不符难题
大数据·前端·数据库·人工智能·精益工程
大龄程序员狗哥26 分钟前
第46篇:语音识别入门——让AI“听懂”人类语言(概念入门)
人工智能·语音识别