阶跃星辰(StepFun)已于近期正式发布了开源图像生成模型 NextStep

根据最新信息,阶跃星辰(StepFun)已于近期正式发布了开源图像生成模型 NextStep,这标志着其自回归图像生成系列模型的一次重要升级。

下面是其核心信息汇总:

项目 详情
发布状态 已正式发布并开源
模型系列 NextStep
前代版本 NextStep-1(140亿参数)
参数量 150亿参数
核心改进 解决前代可视化故障,提高图像保真度和训练稳定性
关键技术 扩展训练 + Flow-based RL(基于流的强化学习)后训练范式
访问方式 模型权重已在 Hugging Face 平台开源

主要改进与技术特点

这次更新主要针对前代模型的已知问题进行优化,主要特点如下:

  • 修复可视化故障 :NextStep-1.1的核心目标是解决其前代版本 NextStep-1 中出现的图像"可视化故障"或"可视化异常问题",以提升输出的专业度。

  • 提升图像保真度与训练稳定性

    • 模型通过 "Flow-based RL" 的强化学习后训练方法,改善了生成图像的纹理细节 ,并旨在减少视觉伪影

    • 官方介绍称,这一技术也旨在解决自回归流基模型在强化学习中固有的数值不稳定性问题

与前代模型的区别

为了让你更清楚地了解此次升级,以下是NextStep-1.1与其前代NextStep-1的主要区别:

对比维度 NextStep-1 (前代) NextStep-1.1 (当前版本)
参数量 140亿参数 150亿参数
技术焦点 自回归+连续令牌+轻量级流匹配头 修复可视化故障Flow-based RL
主要目标 验证自回归模型生成高质量图像的可行性 提升图像质量、输出稳定性和训练稳定性

如何获取与使用

  • 开源信息 :该模型的权重文件已在 Hugging Face 平台上开源,可供下载和研究。

  • 性能数据:目前的公开信息中,尚未提及NextStep-1.1在具体基准测试(如WISE、GenEval等)中的详细分数。其性能表现,尤其是在与前代或主流扩散模型的对比上,有待社区进一步的验证和评估。

  • 硬件与部署 :参考前代NextStep-1的经验,这类大型自回归模型通常需要较强的GPU计算资源(如CUDA设备)进行推理。具体的硬件要求和部署文档,建议查阅即将发布的官方仓库说明。

相关推荐
墨染天姬2 小时前
【AI】端侧AIBOX可以部署哪些智能体
人工智能
AI成长日志2 小时前
【Agentic RL】1.1 什么是Agentic RL:从传统RL到智能体学习
人工智能·学习·算法
2501_948114242 小时前
2026年大模型API聚合平台技术评测:企业级接入层的治理演进与星链4SAPI架构观察
大数据·人工智能·gpt·架构·claude
小小工匠2 小时前
LLM - awesome-design-md 从 DESIGN.md 到“可对话的设计系统”:用纯文本驱动 AI 生成一致 UI 的新范式
人工智能·ui
黎阳之光3 小时前
黎阳之光:视频孪生领跑者,铸就中国数字科技全球竞争力
大数据·人工智能·算法·安全·数字孪生
小超同学你好3 小时前
面向 LLM 的程序设计 6:Tool Calling 的完整生命周期——从定义、决策、执行到观测回注
人工智能·语言模型
2501_944934733 小时前
直播运营需要哪些数据分析能力?场观、停留、成交和投流怎么联动分析
数据挖掘·数据分析
智星云算力3 小时前
本地GPU与租用GPU混合部署:混合算力架构搭建指南
人工智能·架构·gpu算力·智星云·gpu租用
jinanwuhuaguo3 小时前
截止到4月8日,OpenClaw 2026年4月更新深度解读剖析:从“能力回归”到“信任内建”的范式跃迁
android·开发语言·人工智能·深度学习·kotlin
xiaozhazha_3 小时前
效率提升80%:2026年AI CRM与ERP深度集成的架构设计与实现
人工智能