计算机的错误计算(二百零四)

摘要 利用两个大模型判断:在(0, ) 范围内, 等价吗?实验表明,两个大模型(其中一个是数学大模型)均在输出幻觉,均说等价!

例1. 在(0, ) 范围内, 等价吗?

下面是一个大模型的回答。



以上为一个大模型的回答。

下面是与另外一个大模型的对话。



点评

(1)首先,它们是不等价的。等价的是:

(2)因此,两个大模型(其中一个是数学大模型)的结论均是错误的。

(3)其中,红色字体 \arccot 是大模型写错了:在latex 排版系统中没有符号 \arccot(虽然有 \arcsin、\arccos、\arctan 等),所以浏览器不认识。

(4)模型一,前3步均是正确的;但是,第4步结论是错误的。说明什么呢?说明它没有智能。

(5)模型二,"设φ=arccot(A),则cotφ=1/A。"显然是错误的。为什么会出现这样的错误呢?为了得出想要的结论?

(6)大模型的推理很厉害。但是,其公然歪说、瞎说,这个怎么说呢?

相关推荐
Kyrie67822 分钟前
SkillOpt:把 Agent 的技能文件当作可训练参数
人工智能
浮生望26 分钟前
上下文工程:为什么现在写 Prompt 不用那么费劲了
llm
冬奇Lab1 小时前
Workflow 系列(07):工程化与版本管理——Workflow 的 CI/CD
人工智能·工作流引擎
两万五千个小时1 小时前
Claude Code 上下文管理(一):为什么 Agent 会"失忆"?
人工智能·架构·开源
两万五千个小时1 小时前
Claude Code 上下文管理(二):零 Token 消耗的压缩三板斧
人工智能·程序员·开源
不好听6131 小时前
从零搭建一个 RAG 语义搜索系统 —— DEMO的初始阶段
javascript·面试·llm
冬奇Lab1 小时前
每日一个开源项目(第150篇):caveman - 为什么用很多 token,少 token 也行——给 AI Agent 装上穴居人嘴巴
人工智能·开源·资讯
贵慜_Derek1 小时前
MAI-04|干净数据在工程上意味着什么:MAI 预训练数据治理
人工智能·算法·llm
feelmylife591 小时前
Agent 记忆设计架构 — 分层记忆:什么时候该记住,什么时候该忘记
人工智能
阿黎梨梨1 小时前
揭秘大语言模型的底层逻辑:从文本分词到高维向量的计算之旅
javascript·人工智能