AIDEEPAI 深度拆解
← 全部拆解
decode

DeepSeek 连续四周霸榜 OpenRouter——开发者用脚投票投出来的第一名

DeepSeekOpenRoutertoken经济国产模型开源模型
播客版
DeepSeek 连续四周霸榜 OpenRouter——开发者用脚投票投出来的第一名 配图 1

DeepSeek 连续四周霸榜 OpenRouter——开发者用脚投票投出来的第一名

6 月 4 日,模型聚合平台 OpenRouter 发了一条只有一句话的推文:「DeepSeek 已经连续四周在我们的 token 份额排行榜上排第一了。」配图是一张折线图,883 个赞,41 次转发。没有发布会,没有 benchmark 截图,没有「全球最强」的标题。就是一条平台后台数据的播报。

但这条平淡的播报,比任何一份跑分榜都更说明问题。因为它衡量的不是哪个模型在考试里答得最好,而是全世界的开发者,在掏自己钱包调 API 的时候,真实地把活派给了谁。这两件事经常对不上。一个模型可以在 benchmark 上排第三、第五,却在真实调用量上排第一——这正是 DeepSeek 现在的处境,也正是这条推文值得拆开看的地方。

本期看点

  • OpenRouter 是什么:一个把几百个模型接到同一个 API 后面的「模型路由器」,开发者改一行配置就能换模型,所以它的用量数据天然是「用脚投票」的结果。
  • token 份额榜衡量什么:不是谁营销声量大,不是谁跑分高,而是真实流过平台的 token 量——开发者实际烧掉的算力。
  • DeepSeek 为什么能赢:不是因为它最聪明,而是因为它在「够用」的前提下最便宜,而且开源权重可以自托管。性价比在真实生产里的权重,远比榜单想象的高。
  • 对选型的启示:看真实用量榜,比看 benchmark 更接近你自己上生产后的体感。
DeepSeek 连续四周霸榜 OpenRouter——开发者用脚投票投出来的第一名 配图 2

OpenRouter 不是又一个排行榜,它是一个收银台

要理解这条推文为什么重要,得先搞清楚 OpenRouter 是什么。

市面上的 AI 排行榜大多是「考场」:找一批题目(数学、代码、推理),让各家模型答,按分数排名。LMArena 是让人投票选哪个回答更好,也是一种考场。这类榜的问题是,它衡量的是「在受控题目下谁表现好」,离「谁在真实业务里被用得最多」隔着十万八千里。

OpenRouter 不是考场,它是收银台。它是一个 API 聚合层:开发者不直接对接 OpenAI、Anthropic、DeepSeek,而是统一接到 OpenRouter 一个端点上,再由它路由到背后几百个模型。好处是,想从一个模型换到另一个,不用改代码、不用重新申请 key、不用对接新的计费系统,改一行参数就行。

这个「改一行就能换」的设计,让 OpenRouter 的用量数据有了一个别的榜没有的性质:低切换成本。在自家应用里硬接了 GPT,换模型要改一堆东西,惯性会留住你;但在 OpenRouter 上,今天用 A 不顺手,明天就能切到 B,几乎没有摩擦。所以这里的用量排名,剔除了大量「懒得换」的惯性,更接近开发者掂量过性价比之后的真实选择。

平台官方的说法是,排名「基于 benchmark 和来自数百万用户的真实使用数据」。注意这句话里的后半段——真实使用数据,才是 token 份额榜的底色。

DeepSeek 连续四周霸榜 OpenRouter——开发者用脚投票投出来的第一名 配图 3

token 份额榜:数钱不数嘴

那么「token 份额排行榜」到底数的是什么?

数的是 token——模型处理的文本最小单位,输入加输出都算。一次 API 调用,你喂进去的提示词和模型吐出来的回答,都被切成 token 计费。token 份额,就是某个模型处理的 token 量,占平台总量的比例。

这个指标的关键,在于它和「钱」直接挂钩,又和「营销」彻底脱钩。token 是真金白银烧出来的——每一个 token 都对应开发者付出的算力成本。一个模型 token 份额高,意味着大量开发者愿意持续把工作负载压在它身上,月复一月地付费。这不是「我觉得它好」的态度表达,而是「我真的在用它干活」的行为证据。

跑分榜可以靠针对性优化刷上去,发布会可以靠演示挑最好看的 case,社交媒体声量可以靠运营堆。但 token 份额榜骗不了人:没人会因为一个模型「营销做得好」就持续给它付几百亿 token 的账单。规模化的真实付费,是最诚实的投票。

OpenRouter 自己也把这套数据当回事。它在《State of AI》报告里用平台上累计上百万亿 token 的调用数据,来描绘整个行业的真实用量结构——而不是用谁家的发布会通稿。能登上这张榜的顶端并待住四周,含金量在于「持续」二字:偶尔冲高可能是某个爆款应用一次性灌量,连续四周第一,说明这是结构性的份额,不是一阵风。

DeepSeek 连续四周霸榜 OpenRouter——开发者用脚投票投出来的第一名 配图 4

DeepSeek 凭什么赢:在「够用」的地方做到最便宜

如果 token 份额榜衡量的是真实付费选择,那 DeepSeek 连续四周第一,就等于在问一个问题:当开发者用自己的钱投票时,他们到底在优化什么?

答案不是「最聪明」。在公开的推理、代码 benchmark 上,最顶尖的位置通常被闭源旗舰占着。DeepSeek 优化的是另一个量——单位智能的价格。

看 OpenRouter 上 DeepSeek 的定价就明白了。它最便宜的一档模型,输入价低到每百万 token 一毛钱出头(约 0.10 美元),输出每百万 token 两毛钱(约 0.20 美元),还配着 100 万 token 的超长上下文窗口。这是什么概念?同代的闭源旗舰,输入输出价格往往是它的十倍甚至几十倍。对一个要跑海量调用的生产应用——比如 AI agent 自动执行任务、批量处理文档、做企业知识库检索——成本差一个数量级,直接决定了这门生意算不算得过来。

而 agent 类应用恰恰是当下 token 消耗的大头。一个 agent 自主执行任务时,要多步推理、反复调用外部工具,一次任务烧掉的 token 是普通对话的几十上百倍。当你的应用一天要烧掉几十亿 token,模型「贵十倍但聪明一点点」就成了赔本买卖;「便宜十倍且够用」才是能跑通的账。开发者在 OpenRouter 上的选择,本质是在替这笔账投票。

还有一层别的闭源旗舰给不了的东西:DeepSeek 是开源权重的。这意味着它不只能在 OpenRouter 上按调用付费,还能被下载下来自托管——对数据敏感、想把成本和合规彻底攥在自己手里的团队,这是闭源 API 永远无法提供的退路。一个既能在聚合平台上随时调用、又能搬回自己机房的模型,给开发者的是「不被锁死」的安全感。便宜、够用、不锁死——这三样叠加,才是 DeepSeek 在真实用量上压住对手的真正原因。

DeepSeek 连续四周霸榜 OpenRouter——开发者用脚投票投出来的第一名 配图 5

一条更大的暗线:用量这张榜,国产模型正在改写

DeepSeek 第一,不是孤立事件。把视野从单个模型拉到整张榜,会看到一条更值得从业者警觉的暗线:在 OpenRouter 的真实用量上,中国出品的开源模型正在成片占据前列。

据港媒 dotdotnews 援引 OpenRouter 数据报道,在 5 月中下旬的一个统计周里,中国大模型的周调用量已连续四周超过美国模型——这正好和 DeepSeek 连续四周登顶的节奏对上。一年前,中国模型在这个平台上的流量份额还微不足道;现在,它们合计处理的 token 量已经能和美国模型掰手腕。(这些周度数字来自二手报道、未经平台逐条确认,这里只作趋势参考;能确认的硬事实,是 OpenRouter 官方那条「DeepSeek 连续四周第一」的推文本身。)

这条暗线的分量,在于它发生在「用量」这个最难造假的维度。市场声量、融资额、发布会热度,这些都可以是叙事;但开发者持续掏钱调用的 token 量,是行为。当一类模型在行为数据上成片上位,说明它们已经越过了「值得一试」的尝鲜阶段,进入了「默认就选它」的生产阶段。对它们便宜、开源、够用的认知,已经沉淀成了真实工作流里的肌肉记忆。

对从业者意味着什么

第一,做模型选型时,把真实用量榜放进你的参考清单,而且权重要给够。benchmark 告诉你一个模型「在考场上能考多少分」,token 份额榜告诉你「真实生产里大家用它用得有多重」。后者更接近你上线之后会遇到的体感——因为投票的人和你面对的是同一类问题、同一本成本账。

第二,重新校准「最强」的价值。在 demo 和发布会里,「最聪明」是核心卖点;但在要跑海量调用的真实生产里,「单位智能的价格」往往是决定性变量。在你自己的场景里诚实地评估:你的任务真的需要旗舰级智能,还是一个便宜十倍、够用的模型就能交付同样的业务结果?多数批量、agent、检索类负载,答案是后者。

第三,把「开源可自托管」当成一个战略选项,而不只是技术细节。它给你的是议价权和退路:当一个模型既能在聚合平台上即取即用、又能搬回自己机房,你就不会被任何单一供应商的涨价或政策变动锁死。DeepSeek 这次登顶背后,自托管能力是它区别于闭源旗舰的隐性护城河——这一点,值得每个做长期技术规划的人记进决策清单。

关键词

  • OpenRouter:一个 AI 模型聚合路由平台。开发者接它一个 API,就能调用背后几百个模型,换模型只改一行配置。因为切换成本极低,它的用量数据天然反映「用脚投票」的真实选择。
  • token 份额榜:按模型处理的 token 总量占平台比例排名。token 是文本计费的最小单位,和真金白银的算力成本直接挂钩,所以这张榜衡量真实付费用量,而非营销声量或跑分。
  • token:模型处理文本的最小单位,输入的提示词和输出的回答都被切成 token 计费。一次 API 调用的成本,本质是按 token 数算的。
  • 自托管(self-host):把开源模型的权重下载到自己的服务器上运行,而不是调用别人的 API。好处是数据不出自家机房、成本可控、不被供应商锁死。DeepSeek 等开源模型支持,闭源旗舰不支持。
  • AI agent:能自主多步执行任务、反复调用外部工具的 AI 应用。因为一次任务要反复推理和调用,它消耗的 token 是普通对话的几十上百倍,是当下 token 消耗的大头。

引用

  1. OpenRouter 官方推文(主信源),2026-06-04:「DeepSeek has now topped our token share rankings 4 weeks in a row.」(DeepSeek 已经连续四周在我们的 token 份额排行榜上排第一了。)883 赞 / 41 转发。https://x.com/OpenRouter/status/2062538625225548118
  2. OpenRouter Rankings(实时榜单),口径为「基于 benchmark 和来自数百万用户的真实使用数据」,按周统计。https://openrouter.ai/rankings
  3. OpenRouter DeepSeek 模型与定价页:最便宜一档约 $0.10/M 输入、$0.20/M 输出,100 万 token 上下文。https://openrouter.ai/deepseek
  4. dotdotnews(英文版)报道,2026-05-26:「DeepSeek tops OpenRouter global AI model usage rankings」,称中国大模型周调用量连续四周超过美国模型(周度数字为二手口径,仅作趋势参考)。https://english.dotdotnews.com/a/202605/26/AP6a151281e4b09ea2331677fb.html
  5. OpenRouter《State of AI》:基于平台累计上百万亿 token 调用数据的行业用量研究。https://openrouter.ai/state-of-ai