ChatGPT-4o, 腾讯元宝,通义千问对比测试中文文化

国内的大模型应用我选择了国内综合实力最强的两个,一个是腾讯元宝,一个是通义千问。其它的豆包,Kimi,文心一言等在某些领域也有强于竞品的表现。

问一个中文文化比较基础的问题,我满以为中文文化chatGPT不如国内的大模型。可事实相反,以下是测试结果:

提问词都是同一个:姑妈的儿子和我之间怎么互相称呼

下面是ChatGPT-4o:

下面是腾讯元宝:

以下是通义千问:

ChatGPT-4o回答更全面,腾讯元宝回答对了一半,没有区分女性这种选项,通义千问回答就是错的,给通义一个纠正的机会,仍然回答错误。

这个测试结果让我太意外了,完全没想到,五味陈杂。

相关推荐
AI服务老曹3 分钟前
成为一种国家战略范畴的新基建的智慧园区开源了
运维·人工智能·学习·开源·能源
果冻人工智能8 分钟前
利用“人工怀疑”,来大幅提高AI数学准确率
人工智能
果冻人工智能10 分钟前
10个几乎能替代一整个开发团队的AI工具,你信吗?
人工智能
CoderJia程序员甲1 小时前
NotebookLM:基于 Gemini 2.0 的个性化 AI 研究助手
人工智能·大模型·知识库·gemini·notebooklm
飞思实验室1 小时前
核心案例 | 湖南汽车工程职业大学无人机操控与编队技术实验室
人工智能·机器人·无人机·产学研
weixin_457885821 小时前
DeepSeek:穿透行业知识壁垒的搜索引擎攻防战
人工智能·搜索引擎·ai·deepseek·虎跃办公
索码理1 小时前
初探MCP:对Excel操作不熟练?不怕,MCP来帮你
人工智能·后端·mcp
GXL1 小时前
知识蒸馏概览:模型压缩与智能迁移的桥梁
人工智能
DeepLink2 小时前
🧠 AI论文精读 :《Attention is All You Need》
人工智能·算法