数模测评:doubao1.5>deepseek-v3>gpt-o1

本次测试了当前评价最高的三款大模型doubao1.5、gpt-o1、deepseek-v3(r1崩溃),都是采用无提示词的硬核提问方式,测试视频如下。

gpto1、doubao1.5、deepseek测评

测试方式:

上传美赛六道题目文件

直接提问以下5句话:

  • 这是一道数学建模题目,请做下问题重述

  • 请给出每一个问题的思路

  • 针对每个问题推荐前沿算法

  • 建立第一问数学模型

  • 编写第一问数学模型的程序

相关推荐
HCl+NaOH=NaCl+H_2O4 小时前
数学建模期末速成 聚类分析与判别分析
数学建模
轻语呢喃5 小时前
DeepSeek 接口调用:从 HTTP 请求到智能交互
javascript·deepseek
奔跑吧邓邓子10 小时前
DeepSeek 赋能智能教育知识图谱:从构建到应用的革命性突破
人工智能·知识图谱·应用·deepseek·智能教育
中杯可乐多加冰12 小时前
【解决方案-RAGFlow】RAGFlow显示Task is queued、 Microsoft Visual C++ 14.0 or greater is required.
人工智能·大模型·llm·rag·ragflow·deepseek
人大博士的交易之路21 小时前
今日行情明日机会——20250606
大数据·数学建模·数据挖掘·数据分析·涨停回马枪
阿部多瑞 ABU1 天前
# 从底层架构到应用实践:为何部分大模型在越狱攻击下失守?
gpt·安全·ai·自然语言处理
数模竞赛Paid answer1 天前
数学建模-嘉陵江铊污染事件解题全过程文档及程序
数学建模·数据分析
奔跑吧邓邓子1 天前
DeepSeek 赋能智能养老:情感陪伴机器人的温暖革新
人工智能·机器人·deepseek·智能养老·情感陪伴
kinghighland1 天前
【实操】deepseek + mcp + 本地知识库,实现对 pcap 格式的 VoLTE 呼叫信令的分析诊断
deepseek
阿部多瑞 ABU1 天前
大模型安全测试报告:千问、GPT 全系列、豆包、Claude 表现优异,DeepSeek、Grok-3 与 Kimi 存在安全隐患
gpt·安全·ai