计算机的错误计算(一百八十七)

摘要 用大模型计算 sin(123.456789). 其自变量为弧度。结果保留16位有效数字。第一个大模型是数学大模型。先是只分析,不计算;后经提醒,才给出结果,但是是错误结果。第二个大模型,直接给出了Python代码与结果,其中结果中最后一位数字错误。第三个大模型,也是给出Python代码,代码正确,但是结果错误。

例1. 用大模型计算 sin(123.456789). 其自变量为弧度。结果保留16位有效数字。

下面是与一个数学大模型的对话。



以上为与一个数学大模型的对话。

下面是与另一个大模型的对话。



以上为与另一个大模型的对话。

下面是与第三个大模型的对话。



点评:

(1)正确答案是 -0.8044063476133953(ISRealsoft 提供)。

(2)三个大模型的输出依次为 0.8064165273072594、-0.8044063476133956以及-0.4285105141394708 .

(3)显然,第一个与第三个大模型的输出是错误的;第二个大模型的输出只有 1 位错误数字。

(4)第一个大模型是数学大模型。它先是分析;后经提示,才给出结果。第二个大模型是直接给代码,再结果。第三个大模型说了一句话再给代码并结果。

(5)第一个数学大模型偏重中小学数学?

(6)后两个大模型的代码相同,但是,怎么有一个结果是错误的?看来是没计算,结果是抄来的?

(7)看来大模型的逻辑分析功能很强。但是,计算功能很弱。

相关推荐
冬奇Lab2 小时前
Skill 系列(01):Skill 评测体系——如何量化一个 AI Skill 的质量
人工智能
IT_陈寒5 小时前
Redis内存爆了,原来我漏掉了这个致命配置
前端·人工智能·后端
用户3521802454756 小时前
🎆从 Prompt 到 Skill:让 Spring AI Agent 学会"装新技能"
人工智能·spring boot·ai编程
米小虾7 小时前
手把手教你搭建第一个生产级AI Agent:从选型到实战的完整指南
人工智能·agent
任沫7 小时前
Agent之Function Call
javascript·人工智能·go
米小虾7 小时前
2026年AI Agent全面爆发:从开源生态到企业级应用的进化之路
人工智能·agent
用户6919026813397 小时前
Vibe Coding 开发项目的基本范式
人工智能·设计模式·代码规范
To_OC7 小时前
别再跟 AI 死磕 prompt 了,我写了个 Loop 让它自己改到满意为止
人工智能·aigc·agent
血小溅8 小时前
三大 AI 编码框架深度对比:GSD vs OpenSpec vs Superpowers
人工智能·后端
AlfredZhao8 小时前
AI 编程工作总结:从体验问题到模块能力建设
ai·codex