计算机的错误计算(二百零四)

摘要 利用两个大模型判断:在(0, ) 范围内, 等价吗?实验表明,两个大模型(其中一个是数学大模型)均在输出幻觉,均说等价!

例1. 在(0, ) 范围内, 等价吗?

下面是一个大模型的回答。



以上为一个大模型的回答。

下面是与另外一个大模型的对话。



点评

(1)首先,它们是不等价的。等价的是:

(2)因此,两个大模型(其中一个是数学大模型)的结论均是错误的。

(3)其中,红色字体 \arccot 是大模型写错了:在latex 排版系统中没有符号 \arccot(虽然有 \arcsin、\arccos、\arctan 等),所以浏览器不认识。

(4)模型一,前3步均是正确的;但是,第4步结论是错误的。说明什么呢?说明它没有智能。

(5)模型二,"设φ=arccot(A),则cotφ=1/A。"显然是错误的。为什么会出现这样的错误呢?为了得出想要的结论?

(6)大模型的推理很厉害。但是,其公然歪说、瞎说,这个怎么说呢?

相关推荐
辰同学ovo13 分钟前
用 Chrome DevTools MCP 给 AI 写的页面做“质检“
前端·人工智能·chrome devtools
果汁华27 分钟前
Agent 与 Skill 的使用边界
人工智能
天上路人28 分钟前
采用AI 神经网络降噪技术降噪模组A-59F如何区分“人声”与“环境噪声”?
人工智能·语音识别
啵啵肠28 分钟前
给 AI Agent 一把求职 CLI:推荐一个面向 BOSS 直聘工作流的开源项目 boss-agent-cli
人工智能·github
小新同学^O^33 分钟前
简单学习 --> 模型微调
开发语言·人工智能·python·模型微淘
Muyuan199834 分钟前
30.通过Claude code做项目系统测试
运维·服务器·人工智能·fastapi
Awu12271 小时前
⚡精通 Claude 第 10 课:CLI 完全参考
人工智能·aigc·claude
youmiyoumiyoumi1 小时前
# 微信机器人客服系统搭建:从人工到智能的客服升级
人工智能
Mr数据杨1 小时前
【CanMV K210】通信扩展 WiFi Socket TCP Client 通信
人工智能·硬件开发·canmv k210
dingzd951 小时前
Reddit验证资料测试之后跨境品牌如何提升社区运营可信度
大数据·人工智能·矩阵·新媒体运营·内容营销·跨境