ChatGPT-4o, 腾讯元宝,通义千问对比测试中文文化

国内的大模型应用我选择了国内综合实力最强的两个,一个是腾讯元宝,一个是通义千问。其它的豆包,Kimi,文心一言等在某些领域也有强于竞品的表现。

问一个中文文化比较基础的问题,我满以为中文文化chatGPT不如国内的大模型。可事实相反,以下是测试结果:

提问词都是同一个:姑妈的儿子和我之间怎么互相称呼

下面是ChatGPT-4o:

下面是腾讯元宝:

以下是通义千问:

ChatGPT-4o回答更全面,腾讯元宝回答对了一半,没有区分女性这种选项,通义千问回答就是错的,给通义一个纠正的机会,仍然回答错误。

这个测试结果让我太意外了,完全没想到,五味陈杂。

相关推荐
AI街潜水的八角20 小时前
基于Opencv的条形码识别与创建
人工智能·opencv·计算机视觉
谁怕平生太急20 小时前
Mobile GUI Agent相关学习资料整理
人工智能·大模型
牛奶21 小时前
2026 春涧·前端走向全栈
前端·人工智能·全栈
DeepVis Research21 小时前
【AGI/Simulation】2026年度通用人工智能图灵测试与高频博弈仿真基准索引 (Benchmark Index)
大数据·人工智能·算法·数据集·量化交易
Linux猿21 小时前
2025数字消费发展报告 | 附PDF
人工智能·研报精选
这张生成的图像能检测吗1 天前
(论文速读)CCASeg:基于卷积交叉注意的语义分割多尺度上下文解码
人工智能·深度学习·计算机视觉·语义分割
大猪宝宝学AI1 天前
【AI Infra】BF-PP:广度优先流水线并行
人工智能·性能优化·大模型·模型训练
Jerryhut1 天前
Opencv总结7——全景图像拼接
人工智能·opencv·计算机视觉
Captaincc1 天前
AI 原生下的新的社区形态会是什么
人工智能
崔庆才丨静觅1 天前
Gemini Chat Completion API 申请及使用
chatgpt·api·gemini