阶跃星辰:从技术理想主义到多模态AI独角兽的崛起之路

一、公司概况与创立背景

1.1 公司基本信息确认

阶跃星辰 (英文名:StepFun)是一家专注于通用人工智能(AGI)的创新型科技公司,其全称为上海阶跃星辰智能科技有限公司 。该公司成立于 2023 年 4 月 6 日,注册地址位于上海市徐汇区云锦路 701 号 30 层,法定代表人为姜大昕,注册资本 2000 万元人民币。作为一家以从事软件和信息技术服务业为主的企业,阶跃星辰在短短两年多时间内迅速成长为中国 AI 大模型领域的重要力量,被业界誉为 "AI 六小虎" 之一。

1.2 创始团队背景与技术基因

阶跃星辰的创立源于一位在人工智能领域有着深厚技术积累和丰富产业经验的领军人物 ------姜大昕博士。姜大昕早年从纽约州立大学布法罗分校取得计算机科学博士学位后,曾赴新加坡南洋理工大学计算机科学与工程学院任助理教授。2007 年,他加入微软亚洲研究院任首席研究员,开启了在微软长达 16 年的职业生涯,最终升任微软全球副总裁、微软亚洲互联网工程研究院(STCA)副院长和首席科学家。

在微软期间,姜大昕领导着一支 400 多人的精英团队,负责必应(Bing)搜索引擎的全球搜索体验、AI School China 以及自然语言处理方向的技术研发工作。他主导了微软搜索引擎 Bing、智能语音助手 Cortana、微软云 Azure 以及办公软件套件 Microsoft 365 等知名产品的自然语言理解系统研发。2024 年 12 月,姜大昕入选 2025 IEEE Fellow 名单,这一荣誉充分肯定了他在人工智能领域的杰出贡献。

得益于姜大昕在人工智能领域的深厚积累和对人才的强大吸引力,阶跃星辰迅速集结了一批 AI 领域的顶尖人才。核心团队包括:

  • 朱亦博博士:系统负责人,拥有多次单集群万卡以上的系统建设与管理实践经验,曾在微软、字节跳动、谷歌等公司任职

  • 焦斌星:数据负责人,此前担任微软必应引擎核心搜索团队负责人

  • 张祥雨:ResNet 作者之一的 AI 科学家,在计算机视觉领域享有盛誉

这支技术团队的共同特点是都曾在国际顶级科技公司担任要职,拥有丰富的大规模系统建设和管理经验,为阶跃星辰的技术创新奠定了坚实基础。

1.3 创立初衷与愿景使命

阶跃星辰的创立并非一时冲动,而是源于创始团队对人工智能发展趋势的深刻洞察和对技术理想的执着追求。2022 年底、2023 年初,随着 ChatGPT 的横空出世,大模型浪潮席卷全球。正如联合创始人李璟所言:"大模型这个浪潮实在是太大了,2022 年底、2023 年初时,身边很多朋友都决心要干大模型,大家觉得这一次真的不一样"。

姜大昕在微软期间就一直关注着 AI 技术的发展,ChatGPT 的出现给他带来了深刻影响,促使他离开长期工作的公司,踏上创业之旅。在创立阶跃星辰时,创始团队就明确了公司的使命:"智能阶跃,十倍每一个人的可能"(Scale-up possibilities for everyone)。这一使命体现了阶跃星辰对 AI 技术普惠化的追求,希望通过技术创新让更多人受益于人工智能的发展。

从成立第一天起,阶跃星辰就确立了实现通用人工智能(AGI)的宏伟目标,并制定了清晰的技术路线图:"单模态 --- 多模态 --- 多模理解和生成的统一 --- 世界模型 ---AGI"。这一路线图反映了公司对 AI 技术发展规律的深刻理解,也为后续的产品研发和技术迭代提供了明确指引。

二、发展规模与业务布局

2.1 员工规模与组织架构

阶跃星辰的员工规模呈现出快速增长的态势。根据最新数据,公司目前拥有员工126 人 (2024 年数据),其中算法和技术人员比例接近80%。这一人员结构充分体现了公司作为技术驱动型企业的特点,研发人员占比之高在国内 AI 创业公司中较为罕见。

公司的组织架构相对扁平化,核心管理层包括:

  • 姜大昕:创始人兼 CEO,负责公司整体战略规划和技术研发方向

  • 朱亦博:联合创始人兼副总裁,负责系统架构和工程实现

  • 李璟:联合创始人兼副总裁,负责商业化和市场拓展

  • 郑月蔚:财务负责人,负责财务管理和资本运作

值得注意的是,阶跃星辰在全国多个城市设有办公地点,形成了以上海为总部、多城市协同发展的格局:

  • 上海总部:徐汇区云锦路 701 号 30 层(主要办公地点)

  • 北京办公室:海淀区大恒科技大厦南座 12 层,距离微软中国办公地仅 504 米

  • 深圳办公室:南山区彩讯科技大厦 2201-2202

这种多地布局有利于公司吸引各地优秀人才,同时也便于与不同地区的合作伙伴开展业务合作。

2.2 融资历程与资本实力

阶跃星辰的融资历程虽然相对低调,但每一轮都获得了顶级投资机构的青睐。公司的融资历程如下:

早期融资阶段(2023 年):

  • 成立初期即获得启明创投、五源资本等一线风投的投资支持

  • 字节跳动曾考虑投资但最终未参与

  • 据报道,2023 年 3 月首次浮出水面时估值已达到独角兽(超 10 亿美元)规模

B 轮融资(2024 年 12 月):

  • 2024 年 12 月完成 B 轮融资,总融资金额达数亿美元

  • 投资方阵容强大,包括:

  • 上海国有资本投资有限公司及其旗下基金(领投方)

  • 腾讯投资(战略投资方)

  • 五源资本(财务投资方)

  • 启明创投(财务投资方)

  • 其他国资、战略和财务投资人

  • 投后估值达到20 亿美元(约合人民币 140-200 亿元),成功跻身独角兽行列

最新融资动态(2025 年 7 月):

  • 在 2025 世界人工智能大会期间,上海国有资本投资有限公司生态体系宣布将参与阶跃星辰的最新一轮融资

  • 这表明国资对阶跃星辰的持续看好,也为公司未来发展提供了更强的资本支持

阶跃星辰的融资特点是:

  1. 投资方背景多元化,既有国有资本的战略支持,也有互联网巨头的产业协同,还有顶级 VC 的财务投资

  2. 估值增长迅速,从成立到独角兽仅用时一年多

  3. 融资节奏相对稳健,没有盲目追求高估值和快速扩张

2.3 主要业务板块与产品体系

阶跃星辰的业务布局呈现出 "基础模型 + 行业应用 + 终端产品" 的三层架构,形成了较为完整的 AI 产品生态:

2.3.1 基础模型业务

基础模型是阶跃星辰的核心业务,也是公司技术实力的集中体现。公司已发布的 Step 系列基础模型包括:

语言大模型系列

  • Step-1:千亿参数语言大模型,性能全面超越 GPT-3.5

  • Step-2:万亿参数语言大模型,采用创新 MoE 架构,擅长内容创作,是国内首个由创业公司发布的万亿参数模型

  • Step-1-flash:轻量化版本,适合端侧部署

多模态大模型系列

  • Step-1V:千亿参数多模态模型,支持语音、图像、视频理解

  • Step-1.5V:多模态理解大模型,性能比肩 GPT-4V

  • Step-1.5V-mini:轻量化多模态模型

  • Step-3:首个全尺寸、原生多模态推理模型,总参数量 321B,激活参数量 38B

专项模型系列

  • Step-1X:图像生成模型

  • Step-Video-T2V:视频生成模型,可生成高达 204 帧的视频

  • Step-Audio 系列:端到端语音大模型,包括 Step-Audio 2、Step-Audio 2 mini 等

  • Step-R 系列:推理模型,包括 Step R-mini 等

2.3.2 终端产品业务

阶跃星辰推出了两款主要的 C 端产品,但在发展过程中进行了战略调整:

已停运产品

  • 冒泡鸭(Bubble Duck):角色扮演类 AI 聊天机器人,旨在创造一个 AI 开放世界,通过个性化定制智能体和参与虚拟角色互动来开启全新社交方式。但由于商业化效果不及预期,该产品于 2024 年 12 月停止大范围投入,团队合并至 "跃问"

当前主力产品

  • 跃问(StepChat,现更名为 "阶跃 AI"):多模态 AI 效率工具,用户可以通过输入文字、上传图片、上传文档和发送网址等方式进行提问。2024 年 12 月更名为 "阶跃 AI",标志着产品从传统对话形式向具备自主行动能力的 AI 助手转变
2.3.3 行业解决方案业务

阶跃星辰的行业解决方案主要聚焦于以下领域:

智能终端 Agent

  • 手机领域:已覆盖国内超过一半的头部国产手机厂商,深度合作打造手机 Agent 体验

  • 汽车领域:联合吉利汽车推出 AI 智能座舱,实现行业内端到端语音大模型首次量产上车

  • IoT 设备:与多家 IoT 厂商合作,探索智能家居、智能穿戴等场景应用

垂直行业应用

  • 金融财经:与国泰君安、海通证券等大型金融机构合作,推出 "AI 小财神" 智能金融助手,提供 A 股实时行情、资讯研报解读、金融数据图表等功能

  • 内容创作:为媒体、出版、广告等行业提供 AI 辅助创作工具

  • 零售行业:提供智能推荐、商品识别、库存管理等解决方案

2.3.4 开源生态业务

开源是阶跃星辰的重要战略之一。公司已开源多个业内领先的多模态大模型,包括:

  • Step-Video-T2V 视频生成模型(与吉利汽车联合开源)

  • Step-Audio 系列语音模型(与吉利汽车联合开源)

  • Step-130B Step-Audio-Chat 变体

  • Step-Audio 2 mini:在多个国际基准测试集上取得 SOTA 成绩的端到端语音大模型

  • Step-3:将于 2025 年 7 月 31 日面向全球企业和开发者开源

三、市场地位与竞争格局

3.1 行业地位与市场评价

阶跃星辰在短短两年多时间内就确立了在国内 AI 大模型领域的重要地位,被业界广泛认为是 "AI 六小虎"(智谱、月之暗面、百川智能、MiniMax、阶跃星辰、零一万物)之一。这一地位的获得并非偶然,而是基于公司在技术创新、产品布局和商业化落地等方面的综合实力。

在技术实力方面,阶跃星辰取得了多项突破性成就:

  • Step-2 万亿参数语言大模型在 2024 年 12 月的国际权威榜单LiveBench 中位列全球第五、国内第一,其指令遵循(IF Average)评分达 86.57 分,超越 OpenAI 的 GPT-4o 和谷歌的 Gemini-1.5 等国际顶尖模型

  • 在 "最难 LLM 评测榜单"LiveBench 上,Step-2 成为前十名内唯一的国产大模型,排在其前面的只有 OpenAI 和 Anthropic 两家公司

  • Step-1o Vision 在 2025 年初的知名大模型竞技场 Chatbot Arena 和国内权威评估平台 "司南"(OpenCompass)中,分别拿下了视觉领域中国大模型第一,以及多模态模型榜单第一的成绩

  • 被《麻省理工科技评论》列为除 DeepSeek 之外的 4 家重要中国 AI 公司之一

3.2 核心竞争优势分析

阶跃星辰能够在激烈的市场竞争中脱颖而出,主要得益于以下核心竞争优势:

3.2.1 技术创新能力

阶跃星辰在技术创新方面展现出了强大实力,主要体现在:

架构创新

  • Step-2 采用创新的 MoE(Mixture of Experts)架构,通过部分专家共享参数、异构化专家设计等创新设计,让每个 "专家模型" 都得到充分训练

  • Step-3 采用原创的MFA(Multi-Matrix Factorization Attention)架构,即多矩阵因子分解注意力机制,在 Query-Key 路径上进行低秩分解,并让多个查询头共享同一组 Key/Value 表示

  • 推出AFD(Attention-FFN Disaggregation)分布式推理系统,将 Attention 和 FNN 拆开,使两者在独立子系统中运行,实现分布式推理和流水线优化

性能优势

  • Step-3 在国产芯片上的推理效率最高可达 DeepSeek-R1 的300%

  • 在英伟达 Hopper 架构芯片进行分布式推理时,相较于 DeepSeek-R1 的吞吐量提升超70%

  • 推理解码成本仅为 DeepSeek 的1/3

3.2.2 多模态技术领先

阶跃星辰被业界誉为 "多模态卷王 ",这一称号充分体现了公司在多模态技术方面的领先地位。截至目前,公司已发布22 款自研基座模型 ,其中16 款是多模态模型,占比超 70%。公司的多模态技术优势体现在:

  • 覆盖模态全面:涵盖文字、语音、图像、视频、音乐、推理等全系列

  • 技术路线独特:坚持 "理解生成一体化" 路线,采用原生多模方式,而非传统的 "三段式" 过程

  • 应用场景丰富:多模态能力已落地 OPPO、荣耀等多品牌量产旗舰机型,陪伴上亿用户的日常生活

3.2.3 生态建设能力

阶跃星辰在生态建设方面展现出了强大的整合能力:

产业联盟

  • 2025 年 7 月,联合近 10 家芯片及基础设施厂商发起成立 "模芯生态创新联盟",首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等

  • 这是首次由模型企业牵头与上游算力厂商深度合作,通过底层联合创新提升大模型适配性和算力效率

战略合作伙伴

  • 汽车领域:与吉利汽车集团深度合作,联合开源 Step-Video-T2V 和 Step-Audio 模型

  • 手机领域:与 OPPO、荣耀等头部手机厂商建立战略合作关系

  • 金融领域:与国泰君安、海通证券、财联社等建立合作关系

  • 机器人领域:与智元机器人、乐森机器人等合作探索具身智能应用

3.3 与主要竞争对手的对比

在国内 AI 大模型市场,阶跃星辰面临着来自不同类型企业的竞争。通过对比分析,可以更清晰地认识阶跃星辰的市场定位:

公司 成立时间 核心优势 主要产品 融资情况 市场定位
阶跃星辰 2023 年 4 月 多模态技术、推理效率 Step 系列模型 B 轮数亿美元,估值 20 亿美元 AI 六小虎,技术驱动型
DeepSeek 2023 年 10 月 推理能力、成本控制 DeepSeek 系列 未公开 技术黑马,极致优化
智谱 AI 2019 年 知识图谱、认知智能 ChatGLM 系列 30 亿人民币,估值 200 亿 AI 六小虎,知识驱动
MiniMax 2023 年 多模态生成、创意能力 AB 系列模型 近 3 亿美元,估值 40 亿美元 AI 六小虎,应用驱动
百川智能 2023 年 大模型压缩、效率 Baichuan 系列 A1 轮 3 亿美元 AI 六小虎,开源路线
月之暗面 2023 年 多模态理解、视频 Embed 系列 未公开 AI 六小虎,学术背景
零一万物 2023 年 Agent、应用落地 零一模型 未公开 AI 六小虎,产品驱动

从对比中可以看出,阶跃星辰的独特之处在于:

  1. 成立时间相对较晚但发展迅速,在一年内就跻身 AI 六小虎行列

  2. 技术路线清晰,坚持多模态和推理能力并重

  3. 成本控制能力突出,在性能提升的同时实现了成本的大幅降低

  4. 生态建设积极,通过联盟方式整合产业链资源

四、模型发展历程全景图

4.1 技术发展路线图

阶跃星辰从成立之初就制定了清晰的技术发展路线图,这一路线图体现了公司对 AGI 实现路径的深刻理解:

第一阶段:单模态模型(2023 年)

  • 目标:建立基础语言理解能力

  • 核心产品:Step-1 千亿参数语言大模型

  • 技术特点:全面超越 GPT-3.5,奠定技术基石

第二阶段:多模态模型(2023-2024 年)

  • 目标:实现跨模态理解和生成

  • 核心产品:Step-1V、Step-1.5V、Step-1X 等

  • 技术特点:支持语音、图像、视频等多模态输入输出

第三阶段:多模理解生成统一(2024-2025 年)

  • 目标:用一个模型完成多模态理解和生成

  • 核心产品:Step-3、Step-Audio 系列

  • 技术特点:原生多模态架构,理解生成一体化

第四阶段:世界模型(规划中)

  • 目标:构建对世界的综合理解模型

  • 技术特点:整合感知、推理、决策等能力

第五阶段:通用人工智能 AGI(愿景)

  • 目标:实现人类水平的通用智能

  • 技术特点:具备自主学习、创新和创造能力

4.2 关键时间节点与里程碑事件

阶跃星辰的模型发展历程可以划分为几个关键阶段,每个阶段都有重要的技术突破和产品发布:

4.2.1 创立初期与技术积累(2023 年 1-6 月)

2023 年 4 月 6 日,上海阶跃星辰智能科技有限公司正式成立。成立初期,公司主要专注于技术研发和团队建设,在算力、算法、数据和系统四个方面进行了全面布局。创始团队包括姜大昕(CEO)、朱亦博(系统负责人)、焦斌星(数据负责人)等,他们大多来自微软等国际顶级科技公司,拥有丰富的大模型研发经验。

4.2.2 首个模型发布与技术验证(2023 年 7-12 月)

2023 年 7 月:阶跃星辰开始训练首个千亿参数模型 Step-1。这标志着公司从理论研究转向实际产品开发,是技术落地的关键一步。

2023 年 9 月:Step-1 模型初步完成,性能超越 GPT-3.5。这一成果验证了团队的技术实力,也为后续产品研发奠定了信心。

2023 年 11 月:推出千亿参数的多模态模型 Step-1V。这是阶跃星辰在多模态技术方向的首次尝试,标志着公司开始向 "多模态" 阶段迈进。

4.2.3 产品矩阵构建与技术突破(2024 年 1-12 月)

2024 年 3 月:在 2024 全球开发者先锋大会上,阶跃星辰首次公开展示 Step 系列通用大模型,包括:

  • Step-1:千亿参数语言大模型

  • Step-1V:千亿参数多模态大模型

  • Step-2:万亿参数 MoE 语言大模型预览版

这是国内首个由创业公司发布的万亿参数模型,引起了业界广泛关注。

2024 年 4 月:冒泡鸭(APP、网站)的模型备案通过,应用于文本生成场景。这标志着阶跃星辰开始向 C 端产品延伸。

2024 年 6 月:Step-1V 在多模态模型评测中位列第一,性能比肩 GPT-4V。这一成绩证明了阶跃星辰在多模态技术方面的领先地位。

2024 年 7 月 4 日:在 2024 世界人工智能大会上,发布三款 Step 系列通用大模型新品:

  • Step-2 万亿参数语言大模型正式版

  • Step-1.5V 多模态大模型

  • Step-1X 图像生成模型

2024 年下半年重要发布

  • 10 月:视频理解模型 Step-1.5V-turbo 上线开放平台

  • 11 月:多模态理解大模型 Step-1V 上榜 Chatbot Arena,位列视觉领域中国大模型第一

  • 12 月:发布千亿参数端到端语音大模型 Step-1o Audio

  • 12 月:完成数亿美元 B 轮融资,估值达 20 亿美元

4.2.4 推理时代与生态扩张(2025 年 1 月至今)

2025 年 1 月

  • 1 月 15 日:自研推理模型 Step R-mini 上线

  • 1 月 20 日:推出 Step-2 mini 以及 Step-2 文学大师版

2025 年 2 月

  • 2 月 18 日:与吉利汽车集团联合开源 Step-Video-T2V 视频生成模型和 Step-Audio 语音模型

  • 2 月 21 日:举办首届 Step UP 生态开放日,展示系列成果

2025 年 3-6 月

  • 持续发布多个专项模型,包括图像编辑模型 Step1X-Edit、多模态推理模型 Step-R1-V-Mini 等

  • 战略调整:C 端产品 "冒泡鸭" 停运,重心转向终端 Agent

2025 年 7 月 25 日:发布新一代基础大模型 Step 3,这是阶跃星辰首个全尺寸、原生多模态推理模型,具有以下特点:

  • 采用 MoE 架构,总参数量 321B,激活参数量 38B

  • 将于 7 月 31 日面向全球企业和开发者开源

  • 联合近 10 家芯片厂商成立 "模芯生态创新联盟"

4.3 重要模型技术演进分析

4.3.1 Step-1:技术奠基之作

Step-1 是阶跃星辰的第一个大模型产品,也是公司技术实力的首次公开亮相。作为一个千亿参数的语言大模型,Step-1 在性能上全面超越了 GPT-3.5,为公司后续产品研发奠定了坚实基础。

技术特点

  • 参数规模:1000 亿参数

  • 模型架构:经典 Transformer 架构

  • 性能表现:全面超越 GPT-3.5

  • 核心能力:语言理解、文本生成、逻辑推理

Step-1 的成功推出具有重要意义:

  1. 验证了团队的技术实力和工程能力

  2. 为后续模型迭代提供了技术基础

  3. 确立了公司在大模型领域的技术地位

4.3.2 Step-2:万亿参数的突破

Step-2 是阶跃星辰的第二款语言大模型,也是国内首个由创业公司发布的万亿参数模型,代表了公司在大模型技术方面的重大突破。

技术创新

  1. MoE 架构创新
  • 采用创新的 MoE(Mixture of Experts)架构

  • 通过部分专家共享参数、异构化专家设计等创新设计

  • 让每个 "专家模型" 都得到充分训练

  • 总参数量达到万亿级别,激活参数超过市面上大部分 Dense 模型

  1. 训练技术突破
  • 完全自主研发,从头开始训练 MoE 模型

  • 突破了 6D 并行、极致显存管理、完全自动化运维等关键技术

  • 成功完成了 Step-2 的每一次升级

  1. 性能表现
  • 在 LiveBench 榜单中位列全球第五、国内第一

  • 指令遵循(IF Average)评分达 86.57 分

  • 超越 OpenAI 的 GPT-4o 和谷歌的 Gemini-1.5 等国际顶尖模型

4.3.3 Step-3:推理时代的引领者

Step-3 是阶跃星辰的第三代基础大模型,也是公司首个全尺寸、原生多模态推理模型,代表了公司技术发展的最新成果。

架构创新

  1. MFA 注意力机制
  • 采用原创的 MFA(Multi-Matrix Factorization Attention)架构

  • 在 Query-Key 路径上进行低秩分解

  • 让多个查询头共享同一组 Key/Value 表示

  • 从根源上压缩 KV 缓存和乘加量

  1. AFD 分布式推理系统
  • 创新的 Attention-FFN Disaggregation 设计

  • 将 Attention 和 FNN 拆开,在独立子系统中运行

  • 实现分布式推理和流水线优化

  • 避免专家负载不均和网络拥堵问题

  1. 多模态架构
  • 首个全尺寸、原生多模态推理模型

  • 包含独立的视觉编码器(5B 参数)和语言模型(316B 参数)

  • 采用 "轻量视觉路径" 设计,通过双层 2D 卷积对视觉特征进行降采样

  • 将视觉 token 数量减少到原来的 1/16

性能优势

  • 总参数量 321B,激活参数量 38B

  • 国产芯片上推理效率最高可达 DeepSeek-R1 的 300%

  • 英伟达 Hopper 架构上吞吐量提升超 70%

  • 推理解码成本仅为 DeepSeek 的 1/3

4.3.4 多模态模型系列

阶跃星辰在多模态技术方面的布局尤为全面,形成了完整的多模态模型矩阵:

模型名称 发布时间 参数规模 核心能力 技术特点
Step-1V 2023 年 11 月 千亿参数 多模态理解 支持语音、图像、视频
Step-1.5V 2024 年 7 月 - 多模态理解 性能比肩 GPT-4V
Step-1.5V-mini - 轻量化 多模态理解 适合端侧部署
Step-1X 2024 年 7 月 - 图像生成 文生图、图生图
Step-Video-T2V 2025 年 2 月 300 亿参数 视频生成 可生成 204 帧视频
Step-Audio 系列 2024-2025 年 从 3B 到 130B 语音理解与生成 端到端架构
多模态技术特色
  1. 理解生成一体化:采用原生多模方式,用一个模型完成理解和生成

  2. 模态覆盖全面:涵盖文字、语音、图像、视频、音乐等

  3. 技术路线独特:不是 "三段式" 过程,而是统一的多模态架构

4.3.5 专项模型创新

除了基础模型和多模态模型,阶跃星辰还在多个专项领域进行了技术创新:

推理模型系列

  • Step R-mini:轻量化推理模型,支持长思维链推理

  • Step R1 系列:规划中的满血版推理模型,预计推理能力将进一步提升

语音模型系列

  • Step-1o Audio:千亿参数端到端语音大模型,是国内首个千亿参数的端到端语音大模型

  • Step-Audio 2:第二代端到端语音大模型,采用 "真端到端" 设计

  • Step-Audio 2 mini:轻量化版本,在多个国际基准测试集上取得 SOTA 成绩

视频模型系列

  • Step-Video-T2V:文本转视频预训练模型,性能领跑全球开源视频生成大模型

  • Step1X-Edit:图像编辑模型,支持对图像进行精确编辑

五、商业模式与发展战略

5.1 商业化路径与收入结构

阶跃星辰的商业化战略经历了从 C 端产品到 B 端解决方案的重要转变。2024 年 12 月,公司对 C 端产品进行了战略调整,停运了 "冒泡鸭",将重心转向智能终端 Agent 和行业解决方案。这一调整反映了公司对商业化路径的深刻思考和战略聚焦。

当前商业化模式

  1. 智能终端 Agent 业务(核心增长引擎):
  • 手机领域:已覆盖国内超过一半的头部国产手机厂商,通过提供手机端 AI 助手功能获得授权收入

  • 汽车领域:与吉利汽车深度合作,实现端到端语音大模型首次量产上车,通过技术授权和定制开发获得收入

  • IoT 设备:为智能家居、智能穿戴等设备提供 AI 能力,通过技术授权和平台服务收费

  1. 垂直行业解决方案
  • 金融财经:与国泰君安、海通证券等合作,推出 "AI 小财神" 智能金融助手,通过软件许可和服务订阅收费

  • 内容创作:为媒体、出版、广告等行业提供 AI 辅助创作工具,采用 SaaS 订阅模式

  • 零售行业:提供智能推荐、商品识别等解决方案,通过项目制和产品授权结合的方式收费

  1. 技术授权与服务
  • 模型 API 服务:通过提供模型推理 API 接口获得调用费用

  • 私有化部署:为企业客户提供模型私有化部署服务

  • 定制开发:基于客户需求提供模型定制和优化服务

2025 年收入目标与进展

  • 全年收入目标:10 亿元人民币,这是 AI 六小虎中公开的最高年收入目标

  • 上半年进展:已签订合同总额数亿元,确认收入和毛利水平表现良好

  • 收入结构:主要来自智能终端 Agent 在各大行业的应用,B 端收入占比超过 80%

5.2 开源策略与生态建设

开源是阶跃星辰的重要战略选择,公司通过开源策略实现了技术影响力和商业价值的双重提升。

开源战略的核心逻辑

  1. 技术影响力构建
  • 通过开源高质量模型提升技术声誉和行业地位

  • 吸引开发者参与,形成技术社区和生态

  • 推动技术标准的建立和推广

  1. 商业价值转化
  • 开源版本作为 "试用版",吸引企业客户购买高级版本

  • 通过开源建立品牌认知,降低市场开拓成本

  • 为定制开发和技术服务创造机会

已开源项目

  • Step-Video-T2V 视频生成模型(与吉利汽车联合开源)

  • Step-Audio 系列语音模型(与吉利汽车联合开源)

  • Step-130B Step-Audio-Chat 变体

  • Step-Audio 2 mini:在多个国际基准测试集上取得 SOTA 成绩

  • Step-3:将于 2025 年 7 月 31 日面向全球开源,预计将成为最强开源多模态推理模型

5.3 生态联盟与战略合作

阶跃星辰通过构建广泛的生态联盟来支撑其商业模式和技术发展:

模芯生态创新联盟(2025 年 7 月成立):

这是阶跃星辰最重要的生态建设举措,联合了近 10 家国内领先的芯片及基础设施厂商:

联盟成员 领域 合作内容
华为昇腾 AI 芯片 Step-3 已实现搭载和运行
沐曦 AI 芯片 初步实现 Step-3 运行
壁仞科技 AI 芯片 芯片适配合作
燧原科技 AI 芯片 初步实现 Step-3 运行
天数智芯 AI 芯片 初步实现 Step-3 运行
无问芯穹 AI 基础设施 算力平台合作
寒武纪 AI 芯片 芯片适配合作
摩尔线程 AI 芯片 芯片适配合作
硅基流动 AI 基础设施 系统优化合作

联盟的核心目标是通过底层联合创新提升大模型适配性和算力效率,为企业和开发者提供高效易用的大模型解决方案。

重要战略合作伙伴

  1. 汽车领域
  • 吉利汽车:深度合作伙伴,联合开源模型,共同开发智能座舱

  • 合作成果:AI 智能座舱 Agent OS,实现端到端语音大模型首次量产上车

  1. 手机领域
  • OPPO:在手机 AI 助手方面深度合作

  • 荣耀:多模态能力已落地其量产旗舰机型

  • 合作模式:为手机厂商提供端侧 AI 能力,包括语音助手、图像识别、文本理解等

  1. 金融领域
  • 国泰君安、海通证券:在金融 AI 应用方面合作

  • 财联社:共同研发 "AI 小财神" 智能金融助手

  1. 机器人领域
  • 智元机器人:在具身智能方面合作

  • 乐森机器人:在机器人 AI 交互方面合作

5.4 未来发展规划

阶跃星辰对未来发展有着清晰的规划和雄心勃勃的目标:

技术发展路线

  1. 继续坚持 "单模态 --- 多模态 --- 多模理解和生成的统一 --- 世界模型 ---AGI" 的技术路线

  2. 重点发展方向:

  • 多模态推理能力提升

  • Agent 智能体技术深化

  • 视觉领域 Transformer 级架构突破

  • 推理模型能力增强,推出 Step R1 系列

商业化目标

  1. 2025 年收入目标:10 亿元人民币,其中 B 端收入占比超过 80%

  2. 中长期目标:成为中国领先的 AI 基础设施和解决方案提供商

生态建设规划

  1. 扩大 "模芯生态创新联盟" 规模,吸引更多芯片和平台厂商加入

  2. 深化与头部企业的战略合作,特别是在汽车、手机、机器人等领域

  3. 加强开源社区建设,建立开发者生态

资本运作计划

  1. 2025 年 7 月,上海国投生态体系将参与最新一轮融资

  2. 关于 IPO,公司表示 "暂时还没有明确的计划,也不着急"

  3. 未来融资将主要用于技术研发、团队扩张和市场拓展

六、面临的挑战与风险

尽管阶跃星辰在短时间内取得了显著成就,但作为一家 AI 创业公司,仍面临着诸多挑战和风险:

6.1 技术竞争压力

AI 大模型领域的技术迭代速度极快,阶跃星辰面临着来自多个方向的竞争压力:

  1. 国际巨头的技术领先:OpenAI、Google、Anthropic 等公司在技术积累和资源投入方面仍有明显优势,特别是在推理能力和多模态理解方面

  2. 国内同行的激烈竞争

  • DeepSeek 在推理效率和成本控制方面表现突出

  • 智谱 AI 在知识图谱和认知智能方面积累深厚

  • MiniMax 在多模态生成和创意能力方面领先

  1. 技术路线的不确定性:多模态技术路径尚未完全明确,不同技术路线之间的竞争激烈

6.2 商业化挑战

虽然阶跃星辰制定了 10 亿元的年收入目标,但实现这一目标仍面临诸多挑战:

  1. 盈利压力:公司副总裁李璟坦言 "暂时还达不到盈利水平",这是整个 AI 行业面临的共同问题

  2. 客户获取成本高:B 端客户的决策周期长,需要大量的技术演示和定制开发,获客成本较高

  3. 产品标准化程度低:不同行业和客户的需求差异较大,难以实现产品的高度标准化

  4. 价格竞争激烈:随着更多玩家进入市场,模型服务的价格战愈演愈烈

6.3 供应链风险

AI 大模型的发展高度依赖于高性能计算资源,阶跃星辰面临着以下供应链风险:

  1. GPU 供应受限:受国际环境影响,高端 GPU 的获取面临不确定性,特别是英伟达 H100 等顶级芯片

  2. 国产芯片适配挑战:虽然公司在国产芯片适配方面取得了突破,但在性能和生态完善度方面仍与国际先进水平存在差距

  3. 算力成本高企:训练和推理大模型需要大量算力资源,成本压力巨大

6.4 人才竞争风险

AI 行业的竞争本质上是人才的竞争,阶跃星辰面临着人才流失的风险:

  1. 行业人才流动频繁:优秀的 AI 人才是稀缺资源,面临着来自大厂和其他创业公司的挖角

  2. 薪酬压力:为了留住核心人才,需要提供有竞争力的薪酬和股权激励

  3. 团队扩张挑战:随着业务快速发展,需要快速扩充团队,但找到合适的人才并不容易

七、总结与展望

7.1 公司发展总结

阶跃星辰作为一家成立仅两年多的 AI 创业公司,在通用人工智能领域展现出了令人瞩目的发展速度和技术实力。从 2023 年 4 月创立至今,公司已经发布了 22 款自研基座模型,其中 16 款为多模态模型,成功跻身 "AI 六小虎" 行列,估值达到 20 亿美元。

公司的成功源于几个关键因素:

  1. 强大的技术基因:创始团队来自微软等国际顶级科技公司,拥有深厚的技术积累和丰富的产业经验

  2. 清晰的技术路线:从成立之初就确立了 AGI 目标和 "单模态 --- 多模态 --- 多模理解和生成的统一 --- 世界模型 ---AGI" 的技术路线

  3. 持续的创新能力:在 MoE 架构、MFA 注意力机制、AFD 分布式推理系统等方面实现了多项技术突破

  4. 灵活的商业策略:及时调整商业化路径,从 C 端产品转向 B 端解决方案,聚焦高价值行业

7.2 模型发展总结

阶跃星辰的模型发展呈现出以下特点:

  1. 快速迭代:从 2023 年 7 月开始训练第一个模型,到 2025 年 7 月发布 Step-3,平均每 3-4 个月就有重要模型发布

  2. 技术领先:在多个国际权威榜单中取得优异成绩,特别是 Step-2 在 LiveBench 上位列全球第五、国内第一

  3. 全面布局:形成了从语言模型到多模态模型,从基础模型到专项模型的完整产品矩阵

  4. 开源战略:通过开源策略提升技术影响力,建立开发者生态

7.3 未来展望

展望未来,阶跃星辰有望在以下几个方面取得更大突破:

技术突破方向

  1. 多模态推理能力持续提升,向世界模型和 AGI 目标迈进

  2. 推理模型性能突破,推出更强的 Step R1 系列

  3. 视觉领域技术创新,在视频生成和图像理解方面取得新突破

商业发展前景

  1. 2025 年 10 亿元收入目标有望实现,主要增长动力来自智能终端 Agent 业务

  2. 在汽车、手机、金融等重点行业建立竞争优势

  3. 通过生态联盟降低成本,提升竞争力

行业影响预测

  1. 有望成为中国 AI 基础设施的重要提供商

  2. 在多模态和推理技术方面引领行业发展

  3. 通过开源策略推动中国 AI 技术的普及和应用

阶跃星辰的发展历程充分证明,在 AI 大模型这个充满机遇与挑战的赛道上,技术创新、战略定力和执行力是企业成功的关键。作为中国 AI 创业公司的代表,阶跃星辰不仅在技术上追求卓越,更在 "智能阶跃,十倍每一个人的可能" 的使命指引下,努力让 AI 技术惠及更多人。随着技术的不断进步和应用场景的持续拓展,阶跃星辰有望成为推动中国 AI 产业发展的重要力量,为实现通用人工智能的宏伟目标贡献力量。

相关推荐
长空任鸟飞_阿康2 小时前
LangGraph 技术详解:基于图结构的 AI 工作流与多智能体编排框架
人工智能·python·langchain
【建模先锋】2 小时前
故障诊断模型讲解:基于1D-CNN、2D-CNN分类模型的详细教程!
人工智能·深度学习·分类·cnn·卷积神经网络·故障诊断·轴承故障诊断
范桂飓2 小时前
模型训练资源需求计算公式
人工智能
其美杰布-富贵-李2 小时前
tsai 中 Learner 机制深度学习笔记
人工智能·笔记·深度学习
KAI智习2 小时前
大模型榜单周报(2025/12/20)
人工智能·大模型
2501_907136822 小时前
AI 小说生成器-基于 Tauri 2.0 + Vue 3 + TypeScript 的智能小说创作工具
人工智能·软件需求
love530love2 小时前
ComfyUI 升级 v0.4.0 踩坑记录:解决 TypeError: QM_Queue.task_done() 报错
人工智能·windows·python·comfyui
金士镧(厦门)新材料有限公司3 小时前
稀土化合物:推动科技发展的“隐形力量”
人工智能·科技·安全·全文检索·生活·能源
牛客企业服务3 小时前
AI简历筛选:破解海量简历处理难题
人工智能