PPIO上线阿里旗舰推理模型Qwen3-235B-A22B-Thinking-2507

本周,PPIO 上线了 Qwen3 系列的最新非推理模型 Qwen3-235B-A22B-Instruct-2507 和代码模型 Qwen3-Coder-480B-A35B-Instruct。

今晚,Qwen3 再上新!PPIO 首发上线 Qwen3 系列最新推理模型 Qwen3-235B-A22B-Thinking-2507

Qwen3-235B-A22B-Thinking-2507 在推理性能和通用能力上均实现巨大飞跃,可比肩 Gemini-2.5 pro、o4-mini 等顶尖闭源模型,并创下全球开源模型 SOTA 最佳性能表现。

现在,前往 PPIO 官网或点击文末阅读原文即可体验,新用户填写邀请码【LYYQD1】可得 15 元代金券。

快速体验入口:https://ppio.com/llm/qwen-qwen3-235b-a22b-thinking-2507

# 01 模型特点

过去三个月,Qwen3-235B-A22B 的思维能力在持续扩展,推理质量和深度明显提升。Qwen3-235B-A22B-Thinking-2507的主要增强功能如下:

🌟在编程(LiveCodeBench)、数学(AIME25)等核心能力上,Qwen3推理模型实现了推理性能的再突破;

🌟在知识(SuperGPQA)、创意写作能力(WritingBench)、人类偏好对齐(Arena-Hard v2)、多语言能力(MultilF)等通用能力上,Qwen3 推理模型也取得了显著进步;

🌟新模型支持 256K 长文本理解 ,处理超长上下文不费力。

注意:此版本增加了思考长度,建议在高度复杂的推理任务中使用它。

Qwen3-235B-A22B-Thinking-2507 只具备推理模式,具有以下特点:

  • 模型类型:因果语言模型

  • 训练阶段:预训练与后训练

  • 参数量:总参数 2350 亿,激活参数 220 亿

  • 非嵌入参数量:2340 亿

  • 层数:94 层

  • 注意力头数(GQA):查询 64 头,键-值 4 头

  • 专家总数:128 个

  • 每次激活专家数:8 个

  • 原生上下文长度:262,144 个 token

# 02 在 PPIO 在线体验

在 PPIO 官网,我们通过几个案例来体验一下 Qwen3-235B-A22B-Thinking-2507。

提问:"strawberry"这个单词里有几个r?

如果你是开发者,可以前往 PPIO 模型服务用户指南,接入Cherry Studio、ChatBox 等工具。查看详细接入教程:

https://ppio.com/docs/model/overview

PPIO 致力于为企业及开发者提供高性能的模型 API 服务,目前已上线 DeepSeek R1/V3、Qwen3、Kimi K2 等系列模型,仅需一行代码即可调用。并且,经过长期实践,PPIO 已经实现大模型推理的 10 倍 + 降本,实现推理效率与资源使用的动态平衡。

相关推荐
亚马逊云开发者6 分钟前
使用Amazon Q Developer CLI快速构建市场分析智能体
人工智能
Coding茶水间11 分钟前
基于深度学习的非机动车头盔检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
图像处理·人工智能·深度学习·yolo·目标检测·机器学习·计算机视觉
Rose sait21 分钟前
【环境配置】Linux配置虚拟环境pytorch
linux·人工智能·python
福客AI智能客服26 分钟前
从被动响应到主动赋能:家具行业客服机器人的革新路径
大数据·人工智能
司南OpenCompass42 分钟前
衡量AI真实科研能力!司南科学智能评测上线
人工智能·多模态模型·大模型评测·司南评测
罗宇超MS1 小时前
如何看待企业自建AI知识库?
人工智能·alm
土星云SaturnCloud1 小时前
液冷“内卷”:在局部优化与系统重构之间,寻找第三条路
服务器·人工智能·ai·计算机外设
智界前沿1 小时前
集之互动AI创意视频解决方案:商业级可控,让品牌创意从“灵感”直达“落地”
人工智能·aigc
baby_hua1 小时前
20251024_PyTorch深度学习快速入门教程
人工智能·pytorch·深度学习