谷歌Gemini编程吊打全场，国产AI全歇菜。

原创jun2025运营思惟

我用它做了个英语词汇学习工具，国内AI一个都没打过！

我不是来吹谷歌的AI，我只是实在没想到，现在AI的差距，已经到了"一个能上天，其他还在地上捡螺丝"的地步。

事情是这样的：

我想做一个简单又实用的英语词汇学习工具 ，功能也不复杂：用户输入一个单词，就能自动生成对应的图片，帮助理解词义、加深记忆。再配个历史记录，界面简洁一点，看起来像个能用的产品。

说白了，就是个AI + 视觉化 + 词汇记忆的小工具。

这个工具的界面：

• 左边是历史记录，自动保存你查过的词和图片；

• 中间是刚生成的新图，风格美观又贴合词义；

• 底部是输入框，直接打单词；

• 右侧还有一个新建对话的模块。

整个体验，两个词概括：高级、好用。

以下是我用的提示词

用web制作一个英语词汇学习工具，功能是可以让用户输入单词，然后快速生成对应的图片。并且可以保存单词和图片历史历史记录。节目要简洁精致高级。左侧是历史记录，中间是图片生成、底部是输入单词输入框。右侧是新建对话列表。

我第一个想到的就是谷歌最新的 Gemini 2.5 Pro 。我给它丢了一句提示词，结果......直接一次生成，完美实现。

不多说，成品链接在这：g.co/gemini/shar...

谷歌 Gemini 2.5 Pro

说白了，人家不只是理解你说了什么，还知道你 "真正想要什么" ，然后一次性把：

• 页面结构**

• 图片生成逻辑**

• 单词输入控制**

• 历史记录存储**

• 前后端打通**

不仅"听懂"，还"落地"，还"优化"，还"美化"。而其他AI------要么只会照着说，要么根本没听懂你说什么。

然后我想看看别的AI能不能也干这活？

ChatGPT（OpenAI）

状况：失败

这是我最意外的一个。

毕竟是业界"教科书级别"的存在，我本以为就算不如Gemini，也能差不多七八成。

结果是------提示词理解偏差，生成的代码不完整，直接运行不了。 连基本界面都没撑起来，逻辑模块也零散。你能感觉到它"知道你想干什么"，但落实到手上的产物，根本用不了。

说白了，有点像你对一个985高材生说："帮我写个网页词典"，他一边点头一边抬头看天，说："词典是什么东西来着？"

阿里通义千问 Qwen-3-235B-A22B

更别说，完全失败，连像样的界面都没整出来。

状况：彻底失败

这个就属于"没听懂你说的话"。

你告诉它：输入单词，生成图片，保存历史。它可能以为你在做个"图书馆查书系统"，然后给你生一大堆乱七八糟的文本逻辑，还不跑前端、不跑接口，根本没意识到你是要一站式的视觉化学习工具。

你给了它考试题，它却在写命题作文："论英语词汇的美妙"。代码？不在考虑范围之内。

字节豆包

状况：功能大致对，但体验直接崩

好像有点东西？

它是唯一一个"勉强能跑起来"的国产模型。

能生成前端界面，输入框也有，页面加载也还行------你会觉得"这有戏"，但很快你就会发现一个致命BUG：

词和图完全对不上！

你输入"banana"，它可能给你生成一个"天空"，输入"dog"，来一张"风景"............很努力，但用不了。

大模型懂的是"词和概念"，不是"词和图像"。图像生成的调用模型不精确匹配，缺乏控制力。

有种感觉是它跟一个不靠谱的插画师合作：你说什么，他听着听着开始自由发挥，最后你连单词都不想学了。

腾讯元宝

也是失败。执行力不行，提示理解不通透。

状况：看似听懂了，其实啥都没做成

它一开始给的逻辑结构，倒是有板有眼，像是在说："我明白你的需求！"

然而接下来的执行是灾难：

• 代码冗长，但无模块分工，跑不动；

• 没有真正串联图片生成逻辑；

• 页面结构也出奇地糊涂，像 PPT 转代码的那种自动稿。

它的表现，就像一个实习生程序员------答应得快，动手全靠Ctrl+C + 模糊拼凑，完全缺乏自主实现能力。

Grok AI（X平台马斯克家）

第一次代码直接报错，第二次说要"深度思考"，我等它一会，确实有了界面......但还是------图片生成失败。

状况：有思考能力，但落地能力极弱

这个模型确实让我稍微期待了一下，因为它说了："让我深度思考一下"。

你以为它要来一波灵光乍现，结果------

第一次输出的代码根本运行不了；第二次虽然整出个"能看的界面"，但核心功能图片生成缺失。没API集成、没图像识别、没图像展示，全靠"空壳子"撑场面。

就像是一个满口"我懂产品逻辑"的人，端出来的原型图连按钮都点不动。太哲学了，不实干。

顺便提一下------我又拿Gemini试了个更狠的

提示词："设计一个宇宙太阳系空间3D模型，有星球、宇宙飞船等，要求精致、真实物理效果、极致仿真。"

结果你猜怎么着？一次生成，直接炸裂。

点这里自己感受下这个宇宙级模型

3D太阳系预览链接：g.co/gemini/shar...

我的一点想法

我不觉得别的AI没有潜力，也不是非得"跪谷歌"。但有些现实必须承认：

现在这个阶段，AI编程的上限------谷歌Gemini在撑着；其他AI，不是差一点，是根本不在同一条起跑线上。

尤其是涉及多模态整合（文字、图片、界面、逻辑） ，国内AI真的全线歇菜，哪怕是头部模型，依旧只能把"能运行"当目标，而Gemini已经在"能做产品"了。

这不是一次简单的测试，这是一次****技术代差的实测对比。我也希望国内大模型能赶上来，毕竟大家都想用自己的AI做自己的事。但目前的现状是：

你想搞点像样的AI应用？目前来看，真的只能找谷歌的Gemini。