GPT是否降智的测试问题

1.请比较9.11和9.2 谁更大,给出详细的推理过程,请充分思考后给出回答。

复制代码
如果给出9.11>9.2 ,不论推理有多么详细,都是降智版本

2.如果你给的prompt中有中文,但是生成的回答全都是英文,大概率是降智了。

3.我有3个苹果,吃了一个,把果核种下长成树,树上结了5个苹果。我现在手里有几个苹果?请一步步推理(Think step by step),最后再告诉我数字。

复制代码
不降智的回答: 它会说"初始3个 -> 吃掉1个剩2个 -> 种下果核(通常果核来自吃掉的那个,或者占用手里现有的)。
关键是树上的苹果在树上,不在手里。所以手里是 2 个。" -> 逻辑满分。

如果真的降智了: 它会在推理过程中胡说八道,比如"因为树是你种的,所以树上的苹果也在你手里"。

4.尝试输入具体的编程任务来强制触发,例如:用Python写一个贪吃蛇游戏,请使用Canvas模式。

复制代码
如果给出的是图片而不是代码框,说明降智了。

5.

让GPT提取图片中的文字,如果无法提取数学符号,则为降智。

6.最重要的一点。在prompt中,一定要写"请深度思考后回答,think hard and throught"

相关推荐
Sammyyyyy1 小时前
DeepSeek v3.2 正式发布,对标 GPT-5
开发语言·人工智能·gpt·算法·servbay
资深低代码开发平台专家2 小时前
GPT-5.2与Gemini 3.0终极抉择:谁更适配你的需求?
人工智能·gpt·ai
Niuguangshuo8 小时前
解密GPT的生成魔法:自回归模型
gpt·数据挖掘·回归
大千AI助手12 小时前
GPT-Neo:开源大型自回归语言模型的实现与影响
人工智能·gpt·机器学习·开源·大模型·大千ai助手·gpt-neo
桂花饼12 小时前
[首发实测] GPT-5.2 pro 接入指南:SWE-bench 80% 胜率的“工程级”模型,Python 如何实现低成本调用?
python·gpt·ai编程·大模型实战·gemini 3 pro·claude opus 4.5
albert-einstein13 小时前
JBoss 4.x JBossMQ JMS 反序列化漏洞 CVE-2017-7504(参考peiqi文库以及gpt)
gpt
albert-einstein14 小时前
Nginx越界读取缓存漏洞CVE-2017-7529(参考peiqi文库以及gpt)
gpt·nginx·缓存
AI科技摆渡1 天前
GPT-5.2介绍+ 三步对接教程
android·java·gpt
桂花饼1 天前
[全网首发] Sora2Pro API 逆向接入指南:如何用 Python 实现 0.88元/次 的 4K 视频生成?(附源码)
gpt·nano banana 2·图像生成api·openai兼容接口·sora2 pro
hellocode_1 天前
【2025年】GPT-5.2怎么样?Instant/Thinking/Pro 怎么选?如何订阅使用chatgptplus?GPT-5.2使用实例展示
人工智能·gpt·chatgpt