GPT是否降智的测试问题

波尔德2025-11-25 16:55

1.请比较9.11和9.2 谁更大，给出详细的推理过程，请充分思考后给出回答。

复制代码

如果给出9.11>9.2 ，不论推理有多么详细，都是降智版本

2.如果你给的prompt中有中文，但是生成的回答全都是英文，大概率是降智了。

3.我有3个苹果，吃了一个，把果核种下长成树，树上结了5个苹果。我现在手里有几个苹果？请一步步推理（Think step by step），最后再告诉我数字。

复制代码

不降智的回答： 它会说"初始3个 -> 吃掉1个剩2个 -> 种下果核（通常果核来自吃掉的那个，或者占用手里现有的）。
关键是树上的苹果在树上，不在手里。所以手里是 2 个。" -> 逻辑满分。

如果真的降智了： 它会在推理过程中胡说八道，比如"因为树是你种的，所以树上的苹果也在你手里"。

4.尝试输入具体的编程任务来强制触发，例如：用Python写一个贪吃蛇游戏，请使用Canvas模式。

复制代码

如果给出的是图片而不是代码框，说明降智了。

让GPT提取图片中的文字，如果无法提取数学符号，则为降智。

6.最重要的一点。在prompt中，一定要写"请深度思考后回答，think hard and throught"