ChatGPT-4o, 腾讯元宝,通义千问对比测试中文文化

国内的大模型应用我选择了国内综合实力最强的两个,一个是腾讯元宝,一个是通义千问。其它的豆包,Kimi,文心一言等在某些领域也有强于竞品的表现。

问一个中文文化比较基础的问题,我满以为中文文化chatGPT不如国内的大模型。可事实相反,以下是测试结果:

提问词都是同一个:姑妈的儿子和我之间怎么互相称呼

下面是ChatGPT-4o:

下面是腾讯元宝:

以下是通义千问:

ChatGPT-4o回答更全面,腾讯元宝回答对了一半,没有区分女性这种选项,通义千问回答就是错的,给通义一个纠正的机会,仍然回答错误。

这个测试结果让我太意外了,完全没想到,五味陈杂。

相关推荐
美酒没故事°15 小时前
Open WebUI安装指南。搭建自己的自托管 AI 平台
人工智能·windows·ai
云烟成雨TD16 小时前
Spring AI Alibaba 1.x 系列【6】ReactAgent 同步执行 & 流式执行
java·人工智能·spring
AI攻城狮16 小时前
用 Obsidian CLI + LLM 构建本地 RAG:让你的笔记真正「活」起来
人工智能·云原生·aigc
鸿乃江边鸟16 小时前
Nanobot 从onboard启动命令来看个人助理Agent的实现
人工智能·ai
lpfasd12316 小时前
基于Cloudflare生态的应用部署与开发全解
人工智能·agent·cloudflare
俞凡16 小时前
DevOps 2.0:智能体如何接管故障修复和基础设施维护
人工智能
comedate16 小时前
[OpenClaw] GLM 5 关于电影 - 人工智能 - 的思考
人工智能·电影评价
财迅通Ai16 小时前
6000万吨产能承压 卫星化学迎来战略窗口期
大数据·人工智能·物联网·卫星化学
liliangcsdn16 小时前
Agent Memory智能体记忆系统的示例分析
数据库·人工智能·全文检索
GISer_Jing16 小时前
Page-agent MCP结构
前端·人工智能