1.请比较9.11和9.2 谁更大,给出详细的推理过程,请充分思考后给出回答。
如果给出9.11>9.2 ,不论推理有多么详细,都是降智版本
2.如果你给的prompt中有中文,但是生成的回答全都是英文,大概率是降智了。
3.我有3个苹果,吃了一个,把果核种下长成树,树上结了5个苹果。我现在手里有几个苹果?请一步步推理(Think step by step),最后再告诉我数字。
不降智的回答: 它会说"初始3个 -> 吃掉1个剩2个 -> 种下果核(通常果核来自吃掉的那个,或者占用手里现有的)。
关键是树上的苹果在树上,不在手里。所以手里是 2 个。" -> 逻辑满分。
如果真的降智了: 它会在推理过程中胡说八道,比如"因为树是你种的,所以树上的苹果也在你手里"。
4.尝试输入具体的编程任务来强制触发,例如:用Python写一个贪吃蛇游戏,请使用Canvas模式。
如果给出的是图片而不是代码框,说明降智了。
5.
让GPT提取图片中的文字,如果无法提取数学符号,则为降智。
6.最重要的一点。在prompt中,一定要写"请深度思考后回答,think hard and throught"