GPT是否降智的测试问题

1.请比较9.11和9.2 谁更大,给出详细的推理过程,请充分思考后给出回答。

复制代码
如果给出9.11>9.2 ,不论推理有多么详细,都是降智版本

2.如果你给的prompt中有中文,但是生成的回答全都是英文,大概率是降智了。

3.我有3个苹果,吃了一个,把果核种下长成树,树上结了5个苹果。我现在手里有几个苹果?请一步步推理(Think step by step),最后再告诉我数字。

复制代码
不降智的回答: 它会说"初始3个 -> 吃掉1个剩2个 -> 种下果核(通常果核来自吃掉的那个,或者占用手里现有的)。
关键是树上的苹果在树上,不在手里。所以手里是 2 个。" -> 逻辑满分。

如果真的降智了: 它会在推理过程中胡说八道,比如"因为树是你种的,所以树上的苹果也在你手里"。

4.尝试输入具体的编程任务来强制触发,例如:用Python写一个贪吃蛇游戏,请使用Canvas模式。

复制代码
如果给出的是图片而不是代码框,说明降智了。

5.

让GPT提取图片中的文字,如果无法提取数学符号,则为降智。

6.最重要的一点。在prompt中,一定要写"请深度思考后回答,think hard and throught"

相关推荐
量子位5 小时前
Nano Banana新玩法无限套娃!“GPT-5都不会处理这种级别的递归”
人工智能·gpt
AIBox36520 小时前
国内可用 ChatGPT 中文版网站推荐(2025年11月最新)
人工智能·gpt·chatgpt
Ma0407131 天前
GPT:生成式预训练变形金刚
gpt
极客BIM工作室3 天前
从Transformer的Encoder与Decoder,到BERT和GPT的独立王国
gpt·bert·transformer
倔强的石头1067 天前
AiOnly大模型深度测评:调用GPT-5 API+RAG知识库,快速构建智能客服机器人
人工智能·gpt·机器人·aionly
boring_1117 天前
KubeFlow
gpt
智算菩萨8 天前
2025年通用大语言模型前沿进展评测:GPT-5.1、Claude 4.5、文心一言5.0 等全面解析
gpt·语言模型·文心一言
智慧地球(AI·Earth)9 天前
GPT-5.1发布!你的AI更暖更智能!
人工智能·gpt·神经网络·aigc·agi
盼小辉丶10 天前
PyTorch实战(10)——从零开始实现GPT模型
人工智能·pytorch·gpt·深度学习