跃阶星辰开源Step 3.7 Flash:原生多模态,最高生成速度400 Tokens/sStep 3.7 Flash 是一个拥有 198B 参数的稀疏专家混合模型,它结合了一个 196B 参数的语言主干网络和一个 1.8B 参数的视觉编码器,以实现原生图像理解。该模型专为高频生产工作负载而设计,每个令牌激活约 110 亿个参数,吞吐量高达每秒 400 个令牌。Step 3.7 Flash 支持 256k 上下文窗口,并提供三种可选的推理级别,让开发者可以轻松在速度、成本和认知深度之间取得平衡。