计算机的错误计算(二百零四)

摘要 利用两个大模型判断:在(0, ) 范围内, 等价吗?实验表明,两个大模型(其中一个是数学大模型)均在输出幻觉,均说等价!

例1. 在(0, ) 范围内, 等价吗?

下面是一个大模型的回答。



以上为一个大模型的回答。

下面是与另外一个大模型的对话。



点评

(1)首先,它们是不等价的。等价的是:

(2)因此,两个大模型(其中一个是数学大模型)的结论均是错误的。

(3)其中,红色字体 \arccot 是大模型写错了:在latex 排版系统中没有符号 \arccot(虽然有 \arcsin、\arccos、\arctan 等),所以浏览器不认识。

(4)模型一,前3步均是正确的;但是,第4步结论是错误的。说明什么呢?说明它没有智能。

(5)模型二,"设φ=arccot(A),则cotφ=1/A。"显然是错误的。为什么会出现这样的错误呢?为了得出想要的结论?

(6)大模型的推理很厉害。但是,其公然歪说、瞎说,这个怎么说呢?

相关推荐
ZhengEnCi1 小时前
Q03-UI设计进阶技巧-让界面更高级的7个核心原则
人工智能
IT_陈寒1 小时前
React的这个渲染问题连官方文档都没说清楚
前端·人工智能·后端
不加辣椒3 小时前
第12章 工具调用与 Agent 提示工程
人工智能
用户1693176172663 小时前
前端给AI消息做日期分组与时间线
人工智能
i晟3 小时前
Claude Code Harness 深度拆解:从你敲回车到模型回复,中间发生了什么
人工智能
用户252736278144 小时前
【踩坑复盘】我在本地跑 RAG 知识库时踩了 5 个大坑,吐血整理避坑指南
人工智能
大模型真好玩4 小时前
LangChain DeepAgents 速通指南(九)—— 生产级智能体框架 DeepAgents Code 源码导读
人工智能·langchain·agent
用户018349301696 小时前
用Zustand管理AI多会话状态
人工智能
垚森7 小时前
我用 GLM-5.2 造了个炸裂主题后台:16 套主题随心切,可在线体验
ai·react
武子康8 小时前
调查研究-198 Agent 到底该记住什么?读懂《What Must Generalist Agents Remember?》
人工智能·openai·agent