相比之前的AI绘图,Nano banana pro对于科研党来说,主要的进步在于:
拥有世界知识,可以很好的理解科学知识、物理原理并正确展示:
这个很重要,之前的AI绘图闹笑话被撤稿的风波,主要就是基于扩散模型的AI生图并不能很好的理解物理世界。
而这一波以GPT4o开头的多模态 Transformer技术,是将文本、图像转换为为同一种token进行输入输出。
Nano banana pro也沿用了这一改进方法。
什么意思?就是你输入的文本,AI能理解它的意思,输出的图像和输入的文字在意思传达上具有高度一致性了。
所以,AI帮我们画示意图、摘要图、封面的时候,真的来了。
**娜姐实测的效果,Nano banana pro出图的效果全面超越GPT 4o。**下面来逐一看看:
1 Nano banana pro画摘要图:

文章核心发现:马铃薯支系(Petota)起源于约800-900万年前 Etuberosum 和 Tomato 支系的远古同倍体杂交。这次杂交带来了双亲基因的组合,直接导致了地下薯块(tuber)的形成,并进而推动了该支系适应多种生态位,引发物种爆发性辐射演化。
Cell原图:
Ancient hybridization underlies tuberization and radiation of the potato lineage

在核心发现的视觉表达上,Nano banana pro已经很精准了,关键是一键直出,不用自己构思,还要一笔一笔的画和调整。
对于学术绘图,要想画的好,核心还是要AI先规划构图,再出图。如果丢给它文章,直接出图,效果就是这样:

意思传达到了,但是视觉效果差很多。
2 综述示意图:
Gemini 3 pro的出图精细化程度比GPT 4o高了很多,细节的表现力更强了。但是,科学意义传达的精确性还是要自己逐一核对:


信号通路的图,都能很好的匹配你的内容。配色构图也很高级。它的thinking思考功能,能自动匹配你的科研绘图场景,效果很不错。
3 解构图
展示一个原件包含的内部组件的结构图,Nano banana pro画的很细致:
SARS-CoV-2 病毒结构图:


4 分步骤展示过程的分图:
病毒入侵宿主细胞过程的流程图:

和之前的版本相比,病毒粒子、细胞结构在各分图中保持高度一致,且分图的精细化细节呈现也更好了。
4 地点标注
利用谷歌地图的grounding能力,实现地点的精确标注。你只需要告诉banana pro地名即可:
根据我提供的信息绘制一幅疫情传播路径示意图:

二、图片的修改
1 直接在对话框告诉Nano banana pro,要怎么修改,不需要重新出图。Banana pro非常擅长这种对话式修改:
移除指定背景:

修改单一元素:

2 导入Lovart.ai进行修改
Nano banan pro对于中文字的显示还是不够精细化。如果你想批量修改,可以导入Lovart.ai进行精细化修改:
它可以把文字和图像分成不同的图层,方便你进行更精细的调整:

今天的介绍就到这里。
如果觉得有用,欢迎在看、转发和点赞!娜姐继续输出有用的AI辅助科研写作、绘图相关技巧和知识。