计算机的错误计算(一百八十七)

摘要 用大模型计算 sin(123.456789). 其自变量为弧度。结果保留16位有效数字。第一个大模型是数学大模型。先是只分析,不计算;后经提醒,才给出结果,但是是错误结果。第二个大模型,直接给出了Python代码与结果,其中结果中最后一位数字错误。第三个大模型,也是给出Python代码,代码正确,但是结果错误。

例1. 用大模型计算 sin(123.456789). 其自变量为弧度。结果保留16位有效数字。

下面是与一个数学大模型的对话。



以上为与一个数学大模型的对话。

下面是与另一个大模型的对话。



以上为与另一个大模型的对话。

下面是与第三个大模型的对话。



点评:

(1)正确答案是 -0.8044063476133953(ISRealsoft 提供)。

(2)三个大模型的输出依次为 0.8064165273072594、-0.8044063476133956以及-0.4285105141394708 .

(3)显然,第一个与第三个大模型的输出是错误的;第二个大模型的输出只有 1 位错误数字。

(4)第一个大模型是数学大模型。它先是分析;后经提示,才给出结果。第二个大模型是直接给代码,再结果。第三个大模型说了一句话再给代码并结果。

(5)第一个数学大模型偏重中小学数学?

(6)后两个大模型的代码相同,但是,怎么有一个结果是错误的?看来是没计算,结果是抄来的?

(7)看来大模型的逻辑分析功能很强。但是,计算功能很弱。

相关推荐
通义灵码6 分钟前
Qoder 全形态产品家族正式发布,并开源 Agentic Coding 产品耐用度评测集
人工智能·开源·ai编程
大白的编程笔记6 分钟前
推理(Inference)系统解释
人工智能
LeeZhao@11 分钟前
【狂飙全模态】狂飙AGI-智能答疑助手
数据库·人工智能·redis·语言模型·aigc·agi
AI浩15 分钟前
DeepSeek-V3.2:推动开源大型语言模型的前沿发展
人工智能·语言模型·自然语言处理
无代码专家18 分钟前
设备巡检数字化解决方案:构建高效闭环管理体系
java·大数据·人工智能
新智元21 分钟前
奥特曼怕了!GPT-5.5「大蒜」决战谷歌,红色警报紧急拉响
人工智能·openai
西柚小萌新21 分钟前
【深入浅出PyTorch】--9.使用ONNX进行部署并推理
人工智能·pytorch·python
LDG_AGI23 分钟前
【推荐系统】深度学习训练框架(十):PyTorch Dataset—PyTorch数据基石
人工智能·pytorch·分布式·python·深度学习·机器学习
oak隔壁找我28 分钟前
Python + Langchain + Streamlit + DashScope 实现一个网页版聊天机器人
人工智能
是Dream呀33 分钟前
昇腾实战|算子模板库Catlass与CANN生态适配
开发语言·人工智能·python·华为