ChatGPT-4o, 腾讯元宝，通义千问对比测试中文文化

micro99812024-06-15 5:08

国内的大模型应用我选择了国内综合实力最强的两个，一个是腾讯元宝，一个是通义千问。其它的豆包，Kimi，文心一言等在某些领域也有强于竞品的表现。

问一个中文文化比较基础的问题,我满以为中文文化chatGPT不如国内的大模型。可事实相反，以下是测试结果：

提问词都是同一个：姑妈的儿子和我之间怎么互相称呼

下面是ChatGPT-4o:

下面是腾讯元宝：

以下是通义千问：

ChatGPT-4o回答更全面，腾讯元宝回答对了一半，没有区分女性这种选项，通义千问回答就是错的，给通义一个纠正的机会，仍然回答错误。

这个测试结果让我太意外了，完全没想到，五味陈杂。

上一篇：NLP——电影评论情感分析

下一篇：【外汇天眼】交易智慧：遵循趋势，稳中求胜

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04AI科技热点日报 | 2026年07月01日 05幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？092026 年 AI 大模型 & AI 编程工具实战全总结 10【解构】DeepSeek V4 发布：技术报告深度解读 + 横向对比六大开源模型，我们的判断是……