GPT是否降智的测试问题

1.请比较9.11和9.2 谁更大,给出详细的推理过程,请充分思考后给出回答。

复制代码
如果给出9.11>9.2 ,不论推理有多么详细,都是降智版本

2.如果你给的prompt中有中文,但是生成的回答全都是英文,大概率是降智了。

3.我有3个苹果,吃了一个,把果核种下长成树,树上结了5个苹果。我现在手里有几个苹果?请一步步推理(Think step by step),最后再告诉我数字。

复制代码
不降智的回答: 它会说"初始3个 -> 吃掉1个剩2个 -> 种下果核(通常果核来自吃掉的那个,或者占用手里现有的)。
关键是树上的苹果在树上,不在手里。所以手里是 2 个。" -> 逻辑满分。

如果真的降智了: 它会在推理过程中胡说八道,比如"因为树是你种的,所以树上的苹果也在你手里"。

4.尝试输入具体的编程任务来强制触发,例如:用Python写一个贪吃蛇游戏,请使用Canvas模式。

复制代码
如果给出的是图片而不是代码框,说明降智了。

5.

让GPT提取图片中的文字,如果无法提取数学符号,则为降智。

6.最重要的一点。在prompt中,一定要写"请深度思考后回答,think hard and throught"

相关推荐
acai_polo1 天前
如何在国内合规、稳定地使用GPT/Claude/Gemini API?中转服务全解析
人工智能·gpt·ai·语言模型·ai作画
迈火2 天前
SD - Latent - Interposer:解锁Stable Diffusion潜在空间的创意工具
人工智能·gpt·计算机视觉·stable diffusion·aigc·语音识别·midjourney
空中楼阁,梦幻泡影2 天前
主流4 大模型(GPT、LLaMA、DeepSeek、QWE)的训练与推理算力估算实例详细数据
人工智能·gpt·llama
晓晓不觉早3 天前
OpenAI Codex App的推出:多代理工作流的新时代
人工智能·gpt
kebijuelun3 天前
Towards Automated Kernel Generation in the Era of LLMs:LLM 时代的自动化 Kernel 生成全景图
人工智能·gpt·深度学习·语言模型
卖芒果的潇洒农民5 天前
20260201 GPT VPC中的CIDR Block 概念
笔记·gpt
薛定谔的猫19825 天前
二十、使用PyTorch和Hugging Face Transformers训练中文GPT-2模型的技术实践
人工智能·pytorch·gpt
向量引擎小橙8 天前
Google 帝国的绝地反击:Gemini 3 深度硬核测评——GPT-5 的噩梦来了吗?
开发语言·人工智能·gpt·深度学习·机器学习
原来是你~呀~8 天前
Kali GPT - 人工智能渗透测试助手Linux部署
linux·人工智能·gpt·网络安全·自动化渗透测试
康康的AI博客8 天前
2026 OpenAI技术全景:GPT-5.2领衔的AI革命与DMXAPI无缝替代方案
人工智能·gpt