计算机的错误计算(二百零四)

摘要 利用两个大模型判断:在(0, ) 范围内, 等价吗?实验表明,两个大模型(其中一个是数学大模型)均在输出幻觉,均说等价!

例1. 在(0, ) 范围内, 等价吗?

下面是一个大模型的回答。



以上为一个大模型的回答。

下面是与另外一个大模型的对话。



点评

(1)首先,它们是不等价的。等价的是:

(2)因此,两个大模型(其中一个是数学大模型)的结论均是错误的。

(3)其中,红色字体 \arccot 是大模型写错了:在latex 排版系统中没有符号 \arccot(虽然有 \arcsin、\arccos、\arctan 等),所以浏览器不认识。

(4)模型一,前3步均是正确的;但是,第4步结论是错误的。说明什么呢?说明它没有智能。

(5)模型二,"设φ=arccot(A),则cotφ=1/A。"显然是错误的。为什么会出现这样的错误呢?为了得出想要的结论?

(6)大模型的推理很厉害。但是,其公然歪说、瞎说,这个怎么说呢?

相关推荐
血小溅14 小时前
三大 AI 编码框架深度对比:GSD vs OpenSpec vs Superpowers
人工智能·后端
AlfredZhao14 小时前
AI 编程工作总结:从体验问题到模块能力建设
ai·codex
武子康17 小时前
调查研究-186 LangChain 和 LangGraph 的区别:从快速构建 Agent 到生产级工作流编排
人工智能·langchain·llm
武子康18 小时前
调查研究-185 CodeGraph 调研:给 AI 编程 Agent 一张代码库地图,少一点反复 grep(2026)
人工智能·openai·claude
aqi0018 小时前
15天学会AI应用开发(八)使用向量数据库实现RAG功能
人工智能·python·大模型·ai编程·ai应用
JouYY19 小时前
简单聊一下Harness层中的人机协同(HITL)
前端框架·llm·agent
混沌福王20 小时前
Electron三端统一架构:运行时Adapter、IPC能力边界与分层设计
人工智能·agent·ai编程
说了很好20 小时前
马尔可夫扩散链+损失函数推导,手把手实现原生Diffusion
人工智能
聂二AI落地内参20 小时前
合同抽取别停在 JSON:标准规则和交易日历才是硬仗
人工智能