数模测评:doubao1.5>deepseek-v3>gpt-o1

本次测试了当前评价最高的三款大模型doubao1.5、gpt-o1、deepseek-v3(r1崩溃),都是采用无提示词的硬核提问方式,测试视频如下。

gpto1、doubao1.5、deepseek测评

测试方式:

上传美赛六道题目文件

直接提问以下5句话:

  • 这是一道数学建模题目,请做下问题重述

  • 请给出每一个问题的思路

  • 针对每个问题推荐前沿算法

  • 建立第一问数学模型

  • 编写第一问数学模型的程序

相关推荐
FF-Studio39 分钟前
【硬核数学 · LLM篇】3.1 Transformer之心:自注意力机制的线性代数解构《从零构建机器学习、深度学习到LLM的数学认知》
人工智能·pytorch·深度学习·线性代数·机器学习·数学建模·transformer
葫三生10 小时前
如何评价《论三生原理》在科技界的地位?
人工智能·算法·机器学习·数学建模·量子计算
wwer14252636312 小时前
数学建模_图论
数学建模·图论
wwer14252636319 小时前
数学建模_熵权法确定权重
数学建模
道可云19 小时前
道可云人工智能每日资讯|浦东启动人工智能创新应用竞赛
人工智能·百度·ar·xr·deepseek
Just_Paranoid21 小时前
华为云Flexus+DeepSeek征文|基于Dify构建音视频内容转录工作流
华为云·音视频·dify·maas·deepseek·flexusx
会飞的果粒橙21 小时前
在Ubuntu24上安装ollama
ollama·deepseek
小明说Java1 天前
华为云Flexus+DeepSeek征文 | 基于华为云Flexus X实例部署Dify平台构建企业行政助手的可用性研究
华为云·maas·deepseek·flexus
FF-Studio1 天前
【硬核数学】3. AI如何应对不确定性?概率论为模型注入“灵魂”《从零构建机器学习、深度学习到LLM的数学认知》
大数据·人工智能·深度学习·机器学习·数学建模·自然语言处理·概率论
前端小盆友1 天前
从零实现一个GPT 【React + Express】--- 【2】实现对话流和停止生成
前端·gpt·react.js