PPIO上线阿里旗舰推理模型Qwen3-235B-A22B-Thinking-2507

本周,PPIO 上线了 Qwen3 系列的最新非推理模型 Qwen3-235B-A22B-Instruct-2507 和代码模型 Qwen3-Coder-480B-A35B-Instruct。

今晚,Qwen3 再上新!PPIO 首发上线 Qwen3 系列最新推理模型 Qwen3-235B-A22B-Thinking-2507

Qwen3-235B-A22B-Thinking-2507 在推理性能和通用能力上均实现巨大飞跃,可比肩 Gemini-2.5 pro、o4-mini 等顶尖闭源模型,并创下全球开源模型 SOTA 最佳性能表现。

现在,前往 PPIO 官网或点击文末阅读原文即可体验,新用户填写邀请码【LYYQD1】可得 15 元代金券。

快速体验入口:https://ppio.com/llm/qwen-qwen3-235b-a22b-thinking-2507

# 01 模型特点

过去三个月,Qwen3-235B-A22B 的思维能力在持续扩展,推理质量和深度明显提升。Qwen3-235B-A22B-Thinking-2507的主要增强功能如下:

🌟在编程(LiveCodeBench)、数学(AIME25)等核心能力上,Qwen3推理模型实现了推理性能的再突破;

🌟在知识(SuperGPQA)、创意写作能力(WritingBench)、人类偏好对齐(Arena-Hard v2)、多语言能力(MultilF)等通用能力上,Qwen3 推理模型也取得了显著进步;

🌟新模型支持 256K 长文本理解 ,处理超长上下文不费力。

注意:此版本增加了思考长度,建议在高度复杂的推理任务中使用它。

Qwen3-235B-A22B-Thinking-2507 只具备推理模式,具有以下特点:

  • 模型类型:因果语言模型

  • 训练阶段:预训练与后训练

  • 参数量:总参数 2350 亿,激活参数 220 亿

  • 非嵌入参数量:2340 亿

  • 层数:94 层

  • 注意力头数(GQA):查询 64 头,键-值 4 头

  • 专家总数:128 个

  • 每次激活专家数:8 个

  • 原生上下文长度:262,144 个 token

# 02 在 PPIO 在线体验

在 PPIO 官网,我们通过几个案例来体验一下 Qwen3-235B-A22B-Thinking-2507。

提问:"strawberry"这个单词里有几个r?

如果你是开发者,可以前往 PPIO 模型服务用户指南,接入Cherry Studio、ChatBox 等工具。查看详细接入教程:

https://ppio.com/docs/model/overview

PPIO 致力于为企业及开发者提供高性能的模型 API 服务,目前已上线 DeepSeek R1/V3、Qwen3、Kimi K2 等系列模型,仅需一行代码即可调用。并且,经过长期实践,PPIO 已经实现大模型推理的 10 倍 + 降本,实现推理效率与资源使用的动态平衡。

相关推荐
大千AI助手15 小时前
Huber损失函数:稳健回归的智慧之选
人工智能·数据挖掘·回归·损失函数·mse·mae·huber损失函数
墨利昂16 小时前
10.17RNN情感分析实验:加载预训练词向量模块整理
人工智能·rnn·深度学习
【建模先锋】16 小时前
一区直接写!CEEMDAN分解 + Informer-LSTM +XGBoost组合预测模型
人工智能·lstm·ceemdan·预测模型·风速预测·时间序列预测模型
fsnine16 小时前
YOLOv2原理介绍
人工智能·计算机视觉·目标跟踪
倔强的石头10616 小时前
AI修图革命:IOPaint+cpolar让废片拯救触手可及
人工智能·cpolar·iopaint
文火冰糖的硅基工坊16 小时前
[人工智能-大模型-15]:大模型典型产品对比 - 数字人
人工智能·大模型·大语言模型
JJJJ_iii16 小时前
【机器学习05】神经网络、模型表示、前向传播、TensorFlow实现
人工智能·pytorch·python·深度学习·神经网络·机器学习·tensorflow
William.csj16 小时前
服务器/Pytorch——对于只调用一次的函数初始化,放在for训练外面和里面的差异
人工智能·pytorch·python
魔术师卡颂16 小时前
不就写提示词?提示词工程为啥是工程?
前端·人工智能·后端
Ingsuifon16 小时前
pytorch踩坑记录
人工智能·pytorch·python