2026 年 05 月 25 日· StepFun（阶跃星辰）decode

阶跃把旗舰送了出去：开源不是慈善，是 100 亿美元估值的入场券

原文：https://x.com/StepFun_ai/status/2058303294544425197

开源模型MoE中国AIIPOStepFun阶跃星辰大模型商业化

播客版

5 月 8 日，阶跃星辰刚关上一轮近 25 亿美元的 Pre-IPO 融资，估值 100 亿美元，投资人名单里既有华勤、立讯、韦尔、中兴这种 A 股代工巨头，也有港府背景的 Hong Kong Investment Corporation。同一时间窗口，StepFun 在 X 上继续把自己今年初开源的 Step 3.5 Flash 摆到 timeline 顶部——总参数 196B、激活 11B、Apache 2.0、SWE-bench Verified 74.4%。

这两件事不是巧合。阶跃正在做一件中国大模型公司很少明说但都在干的事：把旗舰开源模型当成 IPO 叙事资产用。模型不直接产生收入，但模型的"被使用"——HuggingFace 下载、GitHub Star、第三方 benchmark 站点的排名——是它在港交所讲故事的估值锚。

11B 激活跑出 GPT-5.2 同档分数：阶跃在卖什么

先把模型数字摆清楚。Step 3.5 Flash 是稀疏 MoE，288 个路由专家加 1 个共享专家，每个 token 走 Top-8，结果是"用 196B 的记忆、跑 11B 的速度"。第三方平台 artificialanalysis.ai 给它打出的整体智能均值是 81.0，对面 GPT-5.2（xhigh compute）82.2，Claude Opus 4.5 80.6，Gemini 3.0 Pro 80.7（awesomeagents 报道）。

更要命的是成本。在 Hopper GPU 上跑 128K 上下文解码，Step 3.5 Flash 是基准 1.0x、100 tok/s；DeepSeek V3.2 是 6.0x、33 tok/s；Kimi K2.5 是 18.9x、33 tok/s（数字来自 HuggingFace 模型卡）。同样的活，阶跃自家测算便宜 6 倍。

这套组合不是随机的。它精准对应一句话定位——"开源里能跟前沿闭源模型贴脸打、价格还便宜一个数量级"。这条赛道 DeepSeek V3 已经走通过一次，整个行业知道这个故事能换成什么：模型 API 价格全行业雪崩、应用层接入数量爆炸、模型本身成为云厂商不得不上架的标配。阶跃要的就是这套外溢效应，而且时机选在 IPO 之前。

时机：从 2 月开源到 5 月递表前夜

Step 3.5 Flash 不是 5 月才出现的模型。HuggingFace 模型卡写明 release date 是 2026-02-11，4 月 2 日又上线 2603 优化版，加了 low think mode 给 Step Plan 用户。但在 5 月这个时点重新被推到 X 顶部，是因为阶跃刚把上市路径上的所有前置条件凑齐：

4 月：完成股份制改造，拆掉红筹结构（CnTechPost）
5 月初：Pre-IPO 25 亿美元落定，估值 100 亿美元
6 月 30 日前：计划递表港交所，年底前完成上市（Bloomberg 2 月报道）

港股投资人和 A 股代工巨头看不懂 MoE 路由策略，但他们看得懂"对标 GPT-5.2"、看得懂"开源 Apache 2.0"、看得懂"中国六小虎之一"。模型卡和 GitHub README 现在不只是给开发者看的文档，是给券商研究员、给基石投资人、给港交所聆讯材料里的"技术领先性"举证材料。

这件事和闭源路线最大的区别在于：闭源模型的能力声明只有自家 demo 和官方 benchmark 能证；开源模型一上 HuggingFace，artificialanalysis.ai、OpenRouter、SiliconFlow、NVIDIA NIM 这些第三方平台立刻有独立分数和价格数据。开源是把估值故事的可信度外包给生态。 对一家准备上市的公司，这种背书比自家 PR 稿值钱得多。

路线对照：StepFun 不是另一个智谱

这周智谱 GLM-5.1 估值也跳了一档，但两家公司打的是完全不同的牌。

智谱的路线是闭源 + 高定价 + 重 B 端集成。它在政企客户那里靠的是"私有化部署 + 定制 + 合规"这一套传统软件叙事，估值锚是合同金额和客户名单。StepFun 这次选择把旗舰直接 Apache 2.0 开放出去——意味着任何人都可以拿这个权重去做商业化，阶跃不收钱。

那阶跃靠什么赚钱？答案藏在 GitHub README 一句不显眼的描述里：模型"集成了 Claude Code、Codex、Step-DeepResearch"。Step-DeepResearch 是阶跃自家的闭源 Agent 产品。开源底模、闭源产品，这是 Meta Llama 玩过、Mistral 在玩、DeepSeek 也在玩的双轨——底模负责拉流量和心智，上层产品和云 API 负责收钱。

但和 DeepSeek 不一样的是，DeepSeek 走的是"私募基金孵化、不上市、靠模型 API 现金流"，阶跃走的是"VC + 产业资本 + 上市"。这条路要求模型必须看得见摸得着的"被使用"——下载量、第三方接入数、benchmark 排名都是定价输入。这就是为什么阶跃在 5 月这个节点要反复把 Step 3.5 Flash 推到 X 顶部，而不是憋一个 4.0 版本到上市那天。

中国 AI 六小虎现在事实上分化成两组：智谱、月之暗面走的是闭源 + 高客单价 + 估值千亿；StepFun、MiniMax 走的是开源 + 效率叙事 + 估值百亿。两组不是水平差距，是商业模型差距。 港股能不能给开源那一组合理定价，是接下来一年最值得看的实验。

盲区：Apache 2.0 这块招牌的折扣

阶跃的开源策略有几个值得质疑的地方。

第一，Apache 2.0 没有意味着"人人能用"。HuggingFace 模型卡明写：llama.cpp INT4 量化下最低 120GB VRAM。这个门槛把"自由"基本限制在云厂商、大企业和有 8 张 H100 的研究机构。普通开发者只能在 OpenRouter / SiliconFlow 上付费调用，本质上还是 SaaS。开源在这里更接近一个分销渠道，而不是社区共享。

第二，整体智能 81.0 是单一第三方口径。artificialanalysis.ai 是一家独立 benchmark 平台，但它的评估集和加权方式有自己的偏好。Step 3.5 Flash 在 AIME 2025 拿 97.3% 这种近天花板分数，常被解读为"数学接近 frontier"，但 AIME 题目结构和真实工程问题之间的距离，benchmark 是不告诉你的。

第三，IPO 之后开源策略是否延续，没有任何公开承诺。OpenAI 从 GPT-2 开源到 GPT-4 闭源花了 4 年，理由是"安全和商业"。阶跃如果上市成功，董事会里坐进基石投资人后，Step 4 系列还会不会维持 Apache 2.0 是开放问题。投资人付 100 亿美元买的，是阶跃未来的现金流，不是它继续做慈善的承诺。

对 AI 从业者意味着什么

如果你在中国做 AI 应用，今年要决定的是赌哪条供应链。

闭源那一组（智谱、Kimi）给你深度集成、合规背书、SLA 保障，但锁定成本高，模型迭代节奏被对方控制。开源这一组（StepFun、DeepSeek、Qwen）给你权重和推理灵活性，但要自己解决部署、运维、安全的全栈问题，或者绑定 OpenRouter 这类聚合平台。

Step 3.5 Flash 之后，一个具体的判断点出现了：11B 激活、Mac Studio 能跑的模型，意味着推理成本曲线又向下断了一档。两年前花 100 万跑大模型的中型公司，现在花 10 万可以跑同档智能。这不是渐进改善，是赛道边界重新划——之前不能用 AI 的工作流，现在能用了。

如果你在做投资判断，StepFun 这次开源是一个清晰信号：中国大模型公司正在分裂成两种估值故事。闭源那一组对标 OpenAI，估值锚是私有化合同金额；开源那一组对标 Meta + DeepSeek，估值锚是生态规模和云分销。港交所如何给后者定价，会决定接下来 12 个月有多少家公司跟着 StepFun 走开源路线。

阶跃这一步走完，行业看的是结果：能不能用开源换到 100 亿美元的二级市场估值。能，则是中国 Llama 时刻；不能，则是又一个"为了上市开源、上市后回收"的故事。

本期关键词

MoE（Mixture of Experts）混合专家 — 一种把神经网络切成多个"专家"子网络的架构。每个 token 进来时，路由器只挑少数几个专家做计算，其他专家不激活。Step 3.5 Flash 总参 196B 但每个 token 只激活 11B，意思是模型记忆容量按 196B 算，单次推理算力按 11B 算。这是当前开源大模型对抗闭源模型的主要架构选择。

Apache 2.0 许可证 — 开源世界最宽松的协议之一。任何人可以拿权重做商业化、闭源二次开发、嵌入产品里销售，不需要回报给原作者。和 Meta Llama 的"月活 7 亿以下才能商用"附加条款不同，Apache 2.0 没有规模门槛。这是 StepFun 这次开源最激进的部分。

SWE-bench Verified — 真实 GitHub issue 改 bug 的评测集，由 Princeton + OpenAI 联合维护。Verified 版本经过人工筛掉模糊和不可解的样本，是目前 Agentic Coding 能力最被认可的基准之一。74.4% 意味着模型独立解决了将近四分之三的真实开源 issue。

MTP（Multi-Token Prediction）多 token 预测 — 一次前向传播预测多个 token，而不是传统的一次一个。Step 3.5 Flash 用 MTP-3，一次预测 4 个 token。这是它能把吞吐量推到 300 tok/s 的关键技术之一，也是 DeepSeek V3 之后开源模型的标配优化。

SWA（Sliding Window Attention）滑动窗口注意力 — 注意力机制的简化变体。不让每个 token 看完整上下文，只看一个固定窗口内的近邻。Step 3.5 Flash 用 3:1 SWA 比例（3 层滑动窗口配 1 层全注意力），换来 256K 长上下文的成本可控。

Pre-IPO 轮 — 公司在递交上市申请之前最后一轮私募融资。这轮的定价通常和上市发行价直接挂钩，投资人接的是"上市后能高位退出"的预期。StepFun 这轮 25 亿美元、100 亿美元估值，意味着上市发行估值大概率不低于此。

引用

StepFun on X（任务源推文） — X 反爬，本文未引用推文措辞，仅作事件背景
Step 3.5 Flash 模型卡 — 架构、benchmark、解码成本对照表的一手来源
Step 3.5 Flash GitHub — README 标语 + 集成产品清单
Chinese AI startup StepFun nears $2.5 billion funding ahead of Hong Kong IPO — 5 月 8 日融资公告
Tencent-Backed AI Startup StepFun Is Said to Plan Hong Kong IPO — Bloomberg 关于 IPO 计划的首次报道
StepFun's Step 3.5 Flash 评测 — 整体智能 81.0 vs GPT-5.2 / Claude Opus / Gemini 3.0 Pro 的二手对照
Stepfun finishes US$2.5b funding round for HK IPO — 港媒"六小虎"定位
Step 3.5 Flash vs Claude 4.5 Sonnet — 第三方 benchmark 平台对照口径