计算机的错误计算(二百零四)

摘要 利用两个大模型判断:在(0, ) 范围内, 等价吗?实验表明,两个大模型(其中一个是数学大模型)均在输出幻觉,均说等价!

例1. 在(0, ) 范围内, 等价吗?

下面是一个大模型的回答。



以上为一个大模型的回答。

下面是与另外一个大模型的对话。



点评

(1)首先,它们是不等价的。等价的是:

(2)因此,两个大模型(其中一个是数学大模型)的结论均是错误的。

(3)其中,红色字体 \arccot 是大模型写错了:在latex 排版系统中没有符号 \arccot(虽然有 \arcsin、\arccos、\arctan 等),所以浏览器不认识。

(4)模型一,前3步均是正确的;但是,第4步结论是错误的。说明什么呢?说明它没有智能。

(5)模型二,"设φ=arccot(A),则cotφ=1/A。"显然是错误的。为什么会出现这样的错误呢?为了得出想要的结论?

(6)大模型的推理很厉害。但是,其公然歪说、瞎说,这个怎么说呢?

相关推荐
zc.z5 分钟前
基于 LangChain4j 的 RAG 工作流智能体实战
langchain·大模型·springboot·rag智能体
DeepFlow 零侵扰全栈可观测12 分钟前
运动战:AI 时代 IT 运维的决胜之道——DeepFlow 业务全链路可观测性的落地实践
运维·网络·人工智能·arcgis·云计算
链上日记19 分钟前
AgentWin:AI Agent驱动的Web4智能金融新纪元
人工智能·金融
程序员飞哥24 分钟前
重构 AI 思维(一):Prompt Engineering,如何下达不可违抗的指令?
人工智能·后端
冬奇Lab1 小时前
一天一个开源项目(第94篇):Agent Skills - 为 AI 代码助手注入工程师级纪律
人工智能·开源·资讯
Agentic AI人工智能与大数据1 小时前
数据产品运营指南:如何提升用户活跃度?这4个策略让数据产品不再“沉睡”
大数据·ai·产品运营
冬奇Lab1 小时前
RAG 系列(九):效果不好怎么定位——用 RAGAS 做根因诊断
人工智能·llm·源码
火山引擎开发者社区1 小时前
ArkClaw 的技能是不是越多越好?很多人一开始就想错了
人工智能
火山引擎开发者社区1 小时前
星穹方舟基于火山引擎 ArkClaw 推出全场景龙虾硬件
人工智能
Nukepayload21 小时前
用拉康的风格理解 AI 智能体 ~从直觉到代码的原型炼成术·番外篇~
ai·提示词工程