PPIO上线阿里旗舰推理模型Qwen3-235B-A22B-Thinking-2507

本周,PPIO 上线了 Qwen3 系列的最新非推理模型 Qwen3-235B-A22B-Instruct-2507 和代码模型 Qwen3-Coder-480B-A35B-Instruct。

今晚,Qwen3 再上新!PPIO 首发上线 Qwen3 系列最新推理模型 Qwen3-235B-A22B-Thinking-2507

Qwen3-235B-A22B-Thinking-2507 在推理性能和通用能力上均实现巨大飞跃,可比肩 Gemini-2.5 pro、o4-mini 等顶尖闭源模型,并创下全球开源模型 SOTA 最佳性能表现。

现在,前往 PPIO 官网或点击文末阅读原文即可体验,新用户填写邀请码【LYYQD1】可得 15 元代金券。

快速体验入口:https://ppio.com/llm/qwen-qwen3-235b-a22b-thinking-2507

# 01 模型特点

过去三个月,Qwen3-235B-A22B 的思维能力在持续扩展,推理质量和深度明显提升。Qwen3-235B-A22B-Thinking-2507的主要增强功能如下:

🌟在编程(LiveCodeBench)、数学(AIME25)等核心能力上,Qwen3推理模型实现了推理性能的再突破;

🌟在知识(SuperGPQA)、创意写作能力(WritingBench)、人类偏好对齐(Arena-Hard v2)、多语言能力(MultilF)等通用能力上,Qwen3 推理模型也取得了显著进步;

🌟新模型支持 256K 长文本理解 ,处理超长上下文不费力。

注意:此版本增加了思考长度,建议在高度复杂的推理任务中使用它。

Qwen3-235B-A22B-Thinking-2507 只具备推理模式,具有以下特点:

  • 模型类型:因果语言模型

  • 训练阶段:预训练与后训练

  • 参数量:总参数 2350 亿,激活参数 220 亿

  • 非嵌入参数量:2340 亿

  • 层数:94 层

  • 注意力头数(GQA):查询 64 头,键-值 4 头

  • 专家总数:128 个

  • 每次激活专家数:8 个

  • 原生上下文长度:262,144 个 token

# 02 在 PPIO 在线体验

在 PPIO 官网,我们通过几个案例来体验一下 Qwen3-235B-A22B-Thinking-2507。

提问:"strawberry"这个单词里有几个r?

如果你是开发者,可以前往 PPIO 模型服务用户指南,接入Cherry Studio、ChatBox 等工具。查看详细接入教程:

https://ppio.com/docs/model/overview

PPIO 致力于为企业及开发者提供高性能的模型 API 服务,目前已上线 DeepSeek R1/V3、Qwen3、Kimi K2 等系列模型,仅需一行代码即可调用。并且,经过长期实践,PPIO 已经实现大模型推理的 10 倍 + 降本,实现推理效率与资源使用的动态平衡。

相关推荐
二向箔reverse15 分钟前
机器学习入门:线性回归详解与实战
人工智能·机器学习
真就死难23 分钟前
Rerank 模型的其中两种路径:BERT 相似度与 CoT 推理
人工智能·机器学习·rag
无规则ai31 分钟前
AI三巨头:机器学习、深度学习与人工智能解析
人工智能·深度学习·机器学习
不剪发的Tony老师41 分钟前
字节跳动正式开源AI智能体开发平台Coze
人工智能·coze
love530love1 小时前
Windows 如何更改 ModelScope 的模型下载缓存位置?
运维·人工智能·windows·python·缓存·modelscope
一百天成为python专家3 小时前
数据可视化
开发语言·人工智能·python·机器学习·信息可视化·numpy
金井PRATHAMA3 小时前
主要分布在背侧海马体(dHPC)CA1区域(dCA1)的时空联合细胞对NLP中的深层语义分析的积极影响和启示
人工智能·神经网络·自然语言处理
说私域3 小时前
技术赋能与营销创新:开源链动2+1模式AI智能名片S2B2C商城小程序的流量转化路径研究
人工智能·小程序·开源
倒悬于世6 小时前
开源的语音合成大模型-Cosyvoice使用介绍
人工智能·python·语音识别
pk_xz1234567 小时前
光电二极管探测器电流信号处理与指令输出系统
人工智能·深度学习·数学建模·数据挖掘·信号处理·超分辨率重建