深夜突袭,阿里Qwen3登顶全球开源王座!暴击DeepSeek-R1

4月29日凌晨4点,备受全球期待的阿里新一代通义千问模型Qwen3开源。 在GitHub发布后四个小时,Qwen3便获得1.7万个星标,刷新了开源大模型的热度纪录,彻底点燃了开源社区的热情。

一经诞生,Qwen3立刻横扫各大基准,直接登顶全球最强开源模型王座。

这次,阿里一口气开源了8款混合推理模型,覆盖6亿、17亿、40亿、80亿、140亿、320亿、300亿、2350亿全尺寸参数规模。

其中,Qwen3-235B-A22B是Qwen3系列中的旗舰模型,它仅次于全球性能最强的大模型------OpenAI旗下的o3。

在代码、数学、通用能力等基准测试中,Qwen3-235B-A22B和DeepSeek-R1、OpenAI的o1、o3-mini,谷歌的Gemini-2.5-Pro等全球顶级大模型不相上下。

Qwen3最具创新性的突破在于,它是国内首个"混合推理模型",也就是将"快思考"和"慢思考"合二为一,对简单问题可秒回答案,对复杂问题可多步骤深度思考。

例如,难题可以通过扩展推理来解决,而简单的问题可以直接回答,而不会延迟。

这是继Claude 3.7 Sonnet、Gemini 2.5家族后全球唯三的混合推理模型,可以让用户可以根据任务的复杂程度,控制模型的推理过程。

此外,Qwen3也更符合人类偏好,擅长创意写作、角色扮演、多轮对话和指令遵循,从而提供更自然、引人入胜和更真实的对话体验。

在评估模型人类偏好对齐的ArenaHard测评中,Qwen3以95.6分超越了OpenAI-o1及DeepSeek-R1。

至此,阿里通义已开源200余个模型,全球下载量超3亿次,千问衍生模型数超10万个,彻底超越美国Llama,成为全球第一开源模型!

哦对了,Qwen3模型的语言支持,多达119种。

很多南方国家,根本没有能力开发自己语种的大模型。现在有了开源的Qwen3,就能够部署自己的模型了。

从技术平权这个角度来说,阿里是真的NB。

现在我们来测一个关于网页设计能力的Case,看看模型的表现。

这里用的是X上一个很出名的Prompt,主要考验模型的编程、审美和推理能力。

大概1分钟左右,Qwen3就给把代码写好了。

用浏览器打开看看效果,这质量真不错啊。

只能说,源神NB,阿里NB。

那么,现在如何能体验到Qwen3呢?

如果大家嫌本地部署麻烦,也可以直接在浏览器插件DeepSider中免费使用。

目前,Qwen3已同步上线浏览器插件DeepSider,侧边栏展开AI对话框,可同屏对照生成结果。

DeepSider支持Edge浏览器、Chrome浏览器安装。除了Qwen3、DeepSeek R1满血版等国内模型,同时还支持GPT-4o,GPT-4.1、Grok3、Claude 3.5、Claude 3.7、Gemini 2.0等海外顶级大模型。大家也可以横向对比一下各家模型的能力。

在线体验:www.deepsider.ai/

GitHub:github.com/QwenLM/Qwen...

相关推荐
潘达斯奈基~36 分钟前
沐曦玩转 LMDeploy、XTuner 和 InternLM3
aigc
win4r3 小时前
🚀企业级最强开源大模型Qwen3震撼发布!本地部署+全面客观测评!Qwen3-235B-A22B+Qwen3-32B+Qwen3-14B谁是王者?ollama
llm·aigc·openai
ImAlex4 小时前
深入解析模型上下文协议(MCP):AI与数据源无缝集成的标准化之道
aigc·mcp
掉鱼的猫5 小时前
qwen3 惊喜发布,用 ollama + solon ai (java) 尝个鲜
java·openai·deepseek
Blossom.1186 小时前
可解释人工智能(XAI):让机器决策透明化
人工智能·驱动开发·深度学习·目标检测·机器学习·aigc·硬件架构
渭雨轻尘_学习计算机ing8 小时前
手把手玩转MCP:从入门到实战,解锁AI的“万能插头”
aigc·mcp
新智元10 小时前
52 页 PPT,谷歌 Gemini 预训练负责人首次揭秘!扩展定律最优解
人工智能·openai
新智元11 小时前
深夜突袭,阿里 Qwen3 登顶全球开源王座!暴击 DeepSeek-R1,2 小时狂揽 17k 星
人工智能·openai
拳打南山敬老院11 小时前
从零搭建MCP服务:基于Stdio的实践指南
前端·javascript·aigc