ChatGPT-4o, 腾讯元宝,通义千问对比测试中文文化

国内的大模型应用我选择了国内综合实力最强的两个,一个是腾讯元宝,一个是通义千问。其它的豆包,Kimi,文心一言等在某些领域也有强于竞品的表现。

问一个中文文化比较基础的问题,我满以为中文文化chatGPT不如国内的大模型。可事实相反,以下是测试结果:

提问词都是同一个:姑妈的儿子和我之间怎么互相称呼

下面是ChatGPT-4o:

下面是腾讯元宝:

以下是通义千问:

ChatGPT-4o回答更全面,腾讯元宝回答对了一半,没有区分女性这种选项,通义千问回答就是错的,给通义一个纠正的机会,仍然回答错误。

这个测试结果让我太意外了,完全没想到,五味陈杂。

相关推荐
新智元2 分钟前
CUDA 再见了!寒武纪亮出软件全家桶
人工智能·openai
oe10198 分钟前
好文与笔记分享 A Survey of Context Engineering for Large Language Models(下)
人工智能·笔记·语言模型·agent
有为少年9 分钟前
告别乱码:OpenCV 中文路径(Unicode)读写的解决方案
人工智能·opencv·计算机视觉
西西阿西哥15 分钟前
【随便聊聊】和ChatGPT聊聊潜空间
深度学习·chatgpt
FreeCode40 分钟前
LangChain1.0智能体开发:模型使用
人工智能·langchain·agent
张较瘦_1 小时前
[论文阅读] AI+ | 从 “刚性科层” 到 “智能协同”:一文读懂 AI 应对国家安全风险的核心逻辑
论文阅读·人工智能
anscos1 小时前
庭田科技亮相成都复材盛会,以仿真技术赋能产业革新
大数据·人工智能·科技
阿里云大数据AI技术1 小时前
PAI Physical AI Notebook 详解 1:基于 Isaac 仿真的操作动作数据扩增与模仿学习
人工智能
该用户已不存在1 小时前
Vibe Coding 入门指南:从想法到产品的完整路径
前端·人工智能·后端
一只鹿鹿鹿1 小时前
系统安全设计方案书(Word)
开发语言·人工智能·web安全·需求分析·软件系统