ChatGPT-4o, 腾讯元宝,通义千问对比测试中文文化

国内的大模型应用我选择了国内综合实力最强的两个,一个是腾讯元宝,一个是通义千问。其它的豆包,Kimi,文心一言等在某些领域也有强于竞品的表现。

问一个中文文化比较基础的问题,我满以为中文文化chatGPT不如国内的大模型。可事实相反,以下是测试结果:

提问词都是同一个:姑妈的儿子和我之间怎么互相称呼

下面是ChatGPT-4o:

下面是腾讯元宝:

以下是通义千问:

ChatGPT-4o回答更全面,腾讯元宝回答对了一半,没有区分女性这种选项,通义千问回答就是错的,给通义一个纠正的机会,仍然回答错误。

这个测试结果让我太意外了,完全没想到,五味陈杂。

相关推荐
飞哥数智坊3 小时前
我的“龙虾”罢工了!正好对比下GLM、MiniMax、Kimi 3家谁更香
人工智能
风象南4 小时前
很多人说,AI 让技术平权了,小白也能乱杀老师傅 ?
人工智能·后端
董董灿是个攻城狮5 小时前
大模型连载1:了解 Token
人工智能
RoyLin7 小时前
沉睡三十年的标准:HTTP 402、生成式 UI 与智能体原生软件的时代
人工智能
needn9 小时前
TRAE为什么要发布SOLO版本?
人工智能·ai编程
毅航9 小时前
自然语言处理发展史:从规则、统计到深度学习
人工智能·后端
前端付豪10 小时前
LangChain链 写一篇完美推文?用SequencialChain链接不同的组件
人工智能·python·langchain
ursazoo10 小时前
写了一份 7000字指南,让 AI 帮我消化每天的信息流
人工智能·开源·github
_志哥_13 小时前
Superpowers 技术指南:让 AI 编程助手拥有超能力
人工智能·ai编程·测试
YongGit14 小时前
OpenClaw 本地 AI 助手完全指南:飞书接入 + 远程部署实战
人工智能