原创jun2025运营思惟
我用它做了个英语词汇学习工具,国内AI一个都没打过!
我不是来吹谷歌的AI,我只是实在没想到,现在AI的差距,已经到了"一个能上天,其他还在地上捡螺丝"的地步。
事情是这样的:
我想做一个简单又实用的英语词汇学习工具 ,功能也不复杂:用户输入一个单词,就能自动生成对应的图片,帮助理解词义、加深记忆。再配个历史记录,界面简洁一点,看起来像个能用的产品。
说白了,就是个AI + 视觉化 + 词汇记忆的小工具。
这个工具的界面:
- • 左边是历史记录,自动保存你查过的词和图片;
- • 中间是刚生成的新图,风格美观又贴合词义;
- • 底部是输入框,直接打单词;
- • 右侧还有一个新建对话的模块。
整个体验,两个词概括:高级、好用。
以下是我用的提示词
用web制作一个英语词汇学习工具,功能是可以让用户输入单词,然后快速生成对应的图片。并且可以保存单词和图片历史历史记录。节目要简洁精致高级。左侧是历史记录,中间是图片生成、底部是输入单词输入框。右侧是新建对话列表。
我第一个想到的就是谷歌最新的 Gemini 2.5 Pro 。我给它丢了一句提示词,结果......直接一次生成,完美实现。

不多说,成品链接在这:g.co/gemini/shar...
谷歌 Gemini 2.5 Pro
说白了,人家不只是理解你说了什么,还知道你 "真正想要什么" ,然后一次性把:
- • 页面结构**
- • 图片生成逻辑**
- • 单词输入控制**
- • 历史记录存储**
- • 前后端打通**
不仅"听懂",还"落地",还"优化",还"美化"。而其他AI------要么只会照着说,要么根本没听懂你说什么。

然后我想看看别的AI能不能也干这活?
ChatGPT(OpenAI)
状况:失败
这是我最意外的一个。
毕竟是业界"教科书级别"的存在,我本以为就算不如Gemini,也能差不多七八成。
结果是------提示词理解偏差,生成的代码不完整,直接运行不了。 连基本界面都没撑起来,逻辑模块也零散。你能感觉到它"知道你想干什么",但落实到手上的产物,根本用不了。

说白了,有点像你对一个985高材生说:"帮我写个网页词典",他一边点头一边抬头看天,说:"词典是什么东西来着?"
阿里通义千问 Qwen-3-235B-A22B
更别说,完全失败,连像样的界面都没整出来。
状况:彻底失败
这个就属于"没听懂你说的话"。
你告诉它:输入单词,生成图片,保存历史。它可能以为你在做个"图书馆查书系统",然后给你生一大堆乱七八糟的文本逻辑,还不跑前端、不跑接口,根本没意识到你是要一站式的视觉化学习工具。

你给了它考试题,它却在写命题作文:"论英语词汇的美妙"。代码?不在考虑范围之内。
字节豆包
状况:功能大致对,但体验直接崩
好像有点东西?
它是唯一一个"勉强能跑起来"的国产模型。
能生成前端界面,输入框也有,页面加载也还行------你会觉得"这有戏",但很快你就会发现一个致命BUG:
词和图完全对不上!
你输入"banana",它可能给你生成一个"天空",输入"dog",来一张"风景"............很努力,但用不了。
大模型懂的是"词和概念",不是"词和图像"。图像生成的调用模型不精确匹配,缺乏控制力。

有种感觉是它跟一个不靠谱的插画师合作:你说什么,他听着听着开始自由发挥,最后你连单词都不想学了。
腾讯元宝
也是失败。执行力不行,提示理解不通透。
状况:看似听懂了,其实啥都没做成
它一开始给的逻辑结构,倒是有板有眼,像是在说:"我明白你的需求!"
然而接下来的执行是灾难:
- • 代码冗长,但无模块分工,跑不动;
- • 没有真正串联图片生成逻辑;
- • 页面结构也出奇地糊涂,像 PPT 转代码的那种自动稿。

它的表现,就像一个实习生程序员------答应得快,动手全靠Ctrl+C + 模糊拼凑,完全缺乏自主实现能力。
Grok AI(X平台马斯克家)
第一次代码直接报错,第二次说要"深度思考",我等它一会,确实有了界面......但还是------图片生成失败。
状况:有思考能力,但落地能力极弱
这个模型确实让我稍微期待了一下,因为它说了:"让我深度思考一下"。
你以为它要来一波灵光乍现,结果------
第一次输出的代码根本运行不了;第二次虽然整出个"能看的界面",但核心功能图片生成缺失。没API集成、没图像识别、没图像展示,全靠"空壳子"撑场面。

就像是一个满口"我懂产品逻辑"的人,端出来的原型图连按钮都点不动。太哲学了,不实干。
顺便提一下------我又拿Gemini试了个更狠的
提示词:"设计一个宇宙太阳系空间3D模型,有星球、宇宙飞船等,要求精致、真实物理效果、极致仿真。"
结果你猜怎么着?一次生成,直接炸裂。
点这里自己感受下这个宇宙级模型

3D太阳系预览链接:g.co/gemini/shar...
我的一点想法
我不觉得别的AI没有潜力,也不是非得"跪谷歌"。但有些现实必须承认:
现在这个阶段,AI编程的上限------谷歌Gemini在撑着;其他AI,不是差一点,是根本不在同一条起跑线上。
尤其是涉及多模态整合(文字、图片、界面、逻辑) ,国内AI真的全线歇菜,哪怕是头部模型,依旧只能把"能运行"当目标,而Gemini已经在"能做产品"了。
这不是一次简单的测试,这是一次****技术代差的实测对比。我也希望国内大模型能赶上来,毕竟大家都想用自己的AI做自己的事。但目前的现状是:
你想搞点像样的AI应用?目前来看,真的只能找谷歌的Gemini。