GLM-5.2 把"开源"两个字撕开了:1M 上下文、MIT 许可,和那张迟到的成绩单

GLM-5.2 把"开源"两个字撕开了:1M 上下文、MIT 许可,和那张迟到的成绩单
本期关键词:open weights(开放权重,指模型训练完的"成品文件"可以直接下载到自己机器上跑,而不只是连人家服务器用)/ agentic coding(智能体编程,让模型像一个会自己规划、自己动手、自己改 bug 的程序员一样连续干活,而不是问一句答一句)/ MoE(混合专家架构,模型里养着一大群"专家",每次只叫醒其中一小撮干活,所以总参数巨大但实际算力开销小)/ 1M context(百万级上下文,指模型一次能"读进脑子里"的文字量,百万 token 大约相当于一整个中型代码仓库或几本书)
6 月 13 日傍晚 5 点 21 分,智谱把 GLM-5.2 推送给了 GLM Coding Plan 的全量用户——Lite、Pro、Max、团队版,一个不落。官方那句话说得很直接:"在一些前沿模型变得不可用时,我们选择相信,前沿智能应当开放、可用、可构建,并服务于每一位开发者。"英文版本更短,一句 "frontier intelligence belongs to everyone"(前沿智能属于每一个人)。
听上去像是又一次例行的版本号 +0.1。但这次有两件事拧在一起,值得把"开源"这两个字拆开看:第一,GLM-5.2 把上下文窗口从前代的 20 万 token 一口气拉到了 100 万;第二,它发布时一张第三方可验证的 benchmark 成绩单都没有——这在智谱自己的历史上都属于反常。更微妙的是,这次发布距离美国商务部勒令 Anthropic 在 48 小时内切断 Fable 5、Mythos 5 的海外访问,只隔了大约一天。
把这三件事放在一起,GLM-5.2 就不只是一个模型更新,而是一次关于"开源到底意味着什么"的公开表态。下面逐条拆。
一、先把型号和事实钉死:它叫 GLM-5.2,不是 5,也不是 4.7
用户口头说的"glm5.2",核对下来是准的。智谱的 GLM 家族在 2026 年跑出了罕见的季度节奏:GLM-5(2 月)→ GLM-5.1(3 月底)→ GLM-5.2(6 月 13 日)。智谱国际品牌 Z.ai 的发布博客和 HuggingFace 模型页都用同一套口径——GLM-5.2 不是推倒重来,而是在 GLM-5.1 的基座上继续往前推。
硬规格如下,均来自官方与多家独立媒体交叉确认:
- 参数:744B 总参数 / 约 40B 激活 / 384 个专家。这是 MoE(混合专家)结构,意思是模型里养了 384 个"专家网络",每处理一个 token 只叫醒大约 40B 参数那一小撮来干活。所以它账面上有 7440 亿参数,实际每次推理的算力开销却只相当于一个 400 亿参数级别的模型。激活参数量和 GLM-5.1 持平,变的不是模型容量,而是"读进脑子"的能力。
- 上下文:1,000,000 token,最大输出 131,072 token。GLM-5.1 是 20 万 token,5.2 直接 ×5。
- 许可:MIT。这是最宽松的开源协议之一——可商用、可私有化部署、可二次微调,没有地域限制,和 Linux、Redis 用的是同一张许可证。
- 训练:华为昇腾芯片 + MindSpore 框架 + 自研的 slime 异步强化学习基础设施,全程无 NVIDIA 依赖。
这意味着什么?MoE + 1M 上下文这个组合,瞄准的是一个非常具体的活儿:把整个代码仓库一次性塞进模型,让它做仓库级重构、跨多文件改代码、读着文档写代码。ChatForest 的 builder guide 把这个定位讲得很白:"GLM-5.1 是为标准编程任务的 benchmark 跑分优化的,GLM-5.2 则把上下文窗口拉长,服务那些需要把一整个代码库握在手里的工作流。"换句话说,5.2 不是去刷更高的单题分数,而是去啃"一次看完一个工程"这件事。
"If you are evaluating models for repository-scale coding tasks or self-hosted deployments, this release is worth tracking now." (如果你正在为仓库级编程任务或自托管部署选型,这次发布现在就值得盯着。) ——ChatForest, GLM-5.2 Builder Guide

二、1M 上下文不是吹的,但代价被一行字带过了
把上下文从 20 万拉到 100 万,听起来只是个数字。但稍微懂点底层的人会立刻警觉:标准注意力机制的算力开销,是随文本长度的平方涨的。也就是说,文本长度涨 5 倍,蛮干的话算力要涨 25 倍。如果 GLM-5.2 真用蛮力硬扛 1M,推理成本会高到没法商用。
智谱给出的答案藏在 GLM-5 的技术血统里:DeepSeek Sparse Attention(DSA,深度求索稀疏注意力)。这个机制最早在 GLM-5 的技术报告里就写明了——模型不再"每个字都和每个字算一遍关系",而是只挑相关的一小撮子序列去注意。awesomeagents 的拆解说得清楚:"GLM-5.2 用 DeepSeek 稀疏注意力打破了那条平方曲线,只关注序列中相关的子集。"
这里有个值得评论员停下来的地方:智谱在 1M 上下文这件事上,复用的是竞争对手深度求索的注意力方案。国产大模型之间不是各干各的,而是在底层技术上互相借用、彼此咬合。这本身就是开源生态的一个侧写——技术不再是某一家的护城河,而是大家共享的地基。
但 1M 上下文有个被官方一行字带过的代价。DataLearner 在 GLM-5 系列的局限性里写得很实在:"超长上下文(多轮工程任务积累后)存在幻觉风险;MoE 架构在 Agent 超长链路中可能存在路由漂移;响应延迟较高(推理模式下 30–60 秒),高峰期有限流。"翻译成人话:你真把一百万 token 喂进去,模型读是读得进,但读到后面容易记串、容易把不存在的东西当真,而且每次回答可能要等半分钟到一分钟。1M 是能力上限,不是日常体验。能装一百万,和能用好一百万,是两件事。
顺带说一个数据冲突,因为它正好暴露了"新闻抢发"的常态:DataLearner 的模型卡在 6 月 13 当天还写着上下文是 200K,而 IT 之家、知乎、AIWeekly、SCMP、Pandaily、ChatForest 等绝大多数信源都是 1M。这不是谁造假,而是早期收录页面没来得及更新——核数字的时候,越早的页面越要警惕。本文以 1M 为准,因为它有官方口径和多家独立媒体的交叉印证。

三、最反常的一点:发布时没有成绩单
这才是 GLM-5.2 这次发布里最该被拎出来说的事。
回看 2 月的 GLM-5,智谱发布当天就甩出了一张极其完整的 benchmark 大表——SWE-bench Verified 77.8、SWE-bench Multilingual 73.3、Terminal-Bench 2.0 56.2、Vending Bench 2 跑出 4432 美元的模拟经营余额,逐项和 Claude Opus 4.5、Gemini 3 Pro、GPT-5.2 摆在一起比。那是一种"数据说话"的发布姿态。
到了 GLM-5.2,这张表没有了。多个相互独立的信源都点了这件事:
"No independent benchmark results have been published at launch; the company positions it as superior to prior GLM versions on long-horizon coding but third-party verification is pending." (发布时没有任何独立 benchmark 结果公布;公司宣称它在长程编程上优于前代 GLM,但第三方验证尚未到位。) ——AI Weekly, 转引自 Reddit r/LocalLLaMA
ChatForest 说得更不留情面:"No GLM-5.2-specific benchmarks have been published. The model launched without a benchmark release."(没有任何 GLM-5.2 专属的 benchmark 公布,这个模型是不带成绩单上线的。)
那智谱拿什么证明它能打?拿实测案例。Pandaily 报道,GLM-5.2 在智谱自家的 ZCode 3.0 平台上做了几个演示:用一个零依赖的 HTML 文件生成了一座 925 行 SVG 的机械钟,五层同心圆、七个咬合的齿轮、月相指示、绕行的星轨;还用 Three.js 和 Cannon.js 搭了一个能玩的 3D 点球游戏,带 AI 守门员和三档难度;以及一个浏览器里的迷你电子表格,带公式引擎、撤销重做、CSV 导入导出。
这些 demo 很炫,但它们是智谱自己选的、自己跑的、自己展示的。这和第三方在统一标准下的 benchmark 是两码事。一个是"看我能做出多漂亮的东西",一个是"在大家都认的尺子上量一量"。前者证明上限,后者证明可比性。GLM-5.2 这次只给了前者。
可以参考的,只有它的"父辈"GLM-5.1 的成绩:SWE-Bench Pro 58.4(发布时一度超过 GPT-5.4 的 57.7)、AIME 2026 跑到 95.3、综合能力被智谱称为"首个全面对齐 Claude Opus 4.6 的中国模型"。但 5.2 主要改的是上下文引擎,从 200K 拉到 1M——这种改动对编程跑分到底是涨、是平、还是略降,没人知道。把 5.1 的分数套在 5.2 头上,是一种善意的推测,不是事实。

四、还有一个字面上的坑:6 月 16 日,你其实还下载不到它
"开源"这个词在 GLM-5.2 这里,得分两步看。
6 月 13 日发生的,准确说是"开放使用":模型对 Coding Plan 全量用户可用了,你订阅了就能调。而真正意义上的"开放权重"——把那个几百 GB 的模型文件挂到 HuggingFace 上让任何人下载、私有化部署——官方的说法是"下周",也就是 6 月 16 日到 22 日那一周内,但没给确切日期。
写这篇文章时(6 月 16 日)实测:HuggingFace 上 zai-org/GLM-5.2 这个地址,返回的是 404 找不到页面。也就是说,在所有中英文媒体连篇累牍报道"智谱开源 GLM-5.2"的当口,这个模型的权重实际上还没真正放出来。Threads 上有开发者一句话戳破:"Z AI or Zhipu AI released GLM-5.2 (Not open-weight yet?)"(智谱发了 GLM-5.2——但还不是开放权重?)
这不是说智谱在骗人——它白纸黑字写了权重"下周开源",vLLM、SGLang、Ollama 的适配框架也都预告好了。但新闻标题里的"开源"和你电脑上能跑的"开源",中间隔着一周的时间差。如果你是冲着自托管去的,这一周的差别很实在:在权重落地之前,你能碰到的 GLM-5.2 只有一种形态——智谱服务器上那个,通过 API 或 Coding Plan 访问的版本。
定价也顺带核一下,免得被"开源=免费"带偏:API 调用是 $1.40 / 百万 token 输入、$4.40 / 百万 token 输出;包月的 Coding Plan 从 Lite 档 $10/季起。SCMP 报道这个 Coding Plan 的价格"只有 Anthropic 高端套餐的十分之一"。开放权重让你有自己跑的权利,但大多数人实际还是会用便宜的托管服务——开源在这里更多是一种"退路"和"姿态",而非多数人的日常路径。
五、盲区与过于乐观的地方
第一,"开源 SOTA"这个说法,现在没有第三方背书。 智谱宣传 GLM-5.2 是"最强的国产 Coding 模型",但如前所述,没有 benchmark,没有第三方复现。在权重放出、独立评测跑完之前,这句话只能算厂商自述。乐观地把它当成既定事实,是不严谨的。
第二,地缘叙事盖过了技术叙事的风险。 GLM-5.2 的发布被几乎所有媒体框进了同一个故事:它发布在美国商务部勒令 Anthropic 48 小时内切断 Fable 5、Mythos 5 海外访问之后约 24 小时,被普遍解读为"中国开源生态对美国出口管制的战略反击"。SCMP 报道发布后智谱股价大涨。这个故事很性感,但它有个副作用——当一个模型被当成地缘符号来消费时,它技术上到底行不行,反而容易没人较真。"frontier intelligence belongs to everyone" 是一句好口号,但口号不是 SWE-bench 分数。
第三,1M 上下文的实用边界被宣传拉满了。 能塞进一百万 token,不等于在一百万 token 的尾部还能保持注意力不漂、不幻觉。长上下文模型的"中间遗忘"(读了开头和结尾、把中间糊弄过去)是行业通病,GLM-5.2 没有给出针对性的长上下文检索质量数据。把"1M"理解成"能可靠地用满 1M",是过于乐观的。
第四,纯昇腾训练的复现门槛。 "全程无 NVIDIA"是一个很有分量的产业信号,但它也意味着:如果你想完整复现或深度微调这个模型,你的硬件栈最好也在华为昇腾 + MindSpore 这条路上,否则迁移成本不容低估。MIT 许可给了你自由,昇腾血统给了你前提。
六、对从业者意味着什么(可执行)
如果你是用 AI 写代码的开发者: 别急着把 GLM-5.2 当主力。它的 API 现在可用,$1.40/$4.40 的价格对长上下文任务很有竞争力,值得拿你真实的仓库级任务去试——比如丢一个中等项目让它做跨文件重构,看它在几十万 token 之后还记不记得住前面的约定。这是它最该被验证的场景,也是单题 benchmark 测不出来的。但在第三方评测出来之前,别把生产关键路径押上去。
如果你在做自托管/私有化部署: 把 6 月 16–22 日这一周设成提醒,盯 huggingface.co/zai-org 这个组织页,权重一落地就抓。同时提前确认你的推理栈——官方预告了 vLLM(BF16/FP8)、SGLang、Ollama(GGUF)。Ollama 的 GGUF 量化版通常会在权重发布几天后由社区放出,消费级机器跑得动的版本会晚一点到。
如果你在做选型/采购决策: 把"开放使用"和"开放权重"分开记账。GLM-5.2 给你的真正筹码,是 MIT 许可下的退出权——哪怕哪天 API 涨价或不可用,你手里有权重可以自己跑(前提是它真放出来了)。这个退出权在当下的地缘环境里,本身就是一种风险对冲,值得写进供应商评估表。但别为一个还没有第三方成绩单的模型支付"SOTA 溢价"。
如果你只是想看懂这场牌局: 记住一件事——2026 年开源大模型的竞争,主战场已经从"参数多大、跑分多高",移到了"上下文多长、能不能连续干长活、许可证多宽松、训练栈是否去美国化"。GLM-5.2 把这四张牌一次性打了出来:1M、agentic、MIT、纯昇腾。成绩单可以迟到,但牌面已经摊开了。
引用
- Z.ai 官方博客《GLM-5: From Vibe Coding to Agentic Engineering》(2026-02-12) — GLM-5 基座、744B/40B 参数、DSA 稀疏注意力、28.5T token、完整 benchmark 大表的原始出处。https://z.ai/blog/glm-5 (英文,中译:《GLM-5:从氛围编程到智能体工程》)
- HuggingFace
zai-org/GLM-5模型卡 — GLM-5 完整 benchmark 表与脚注(SWE-bench Verified 77.8 等)。https://huggingface.co/zai-org/GLM-5 (英文) - HuggingFace
zai-org/GLM-5.2(实测 404) — 截至 6 月 16 日权重尚未放出的直接证据。https://huggingface.co/zai-org/GLM-5.2 (英文,页面返回 "404 Sorry, we can't find the page") - IT 之家《智谱:GLM-5.2 将面向 GLM Coding Plan 全量用户开放,模型下周正式开源》(2026-06-13) — 6 月 13 日 17:21 全量开放、API 下周、权重下周 MIT 开源的中文一手报道。https://m.ithome.com/html/963855.htm (中文)
- ChatForest《GLM-5.2: Zhipu's 1M-Context Open-Weight Coding Model (Builder Guide)》(2026-06-15) — 744B/40B 架构、1M 上下文工程、模型 ID
glm-5.2[1m]、定价、推理框架适配、"无 5.2 专属 benchmark"的判断。https://chatforest.com/builders-log/zhipu-glm-5-2-1m-context-open-weights-agentic-coding-builder-guide/ (英文) - AI Weekly《Zhipu Deploys GLM 5.2 ... No Benchmarks Published》(2026-06) — "发布时无独立 benchmark、第三方验证待定"的明确表述。https://aiweekly.co/node/2946 (英文,中译:《智谱将 GLM 5.2 部署到全部 Coding Plan 档位……未公布 benchmark》)
- awesomeagents.ai《GLM-5.2 Ships MIT-Licensed, 1M Context, Zero Benchmarks》(2026-06) — 384 专家、DSA 打破平方曲线、发布距 Fable 5/Mythos 5 下线令约 24 小时、"frontier intelligence belongs to everyone" 口号。https://awesomeagents.ai/news/zhipu-glm-5-2-open-source/ (英文)
- Pandaily《Zhipu AI Open-Sources GLM-5.2 With 1 Million Token Context》(2026-06-14) — ZCode 3.0 实测案例(925 行 SVG 机械钟、Three.js 点球游戏、浏览器电子表格)、美国商务部令 Anthropic 48 小时封锁 Fable 5/Mythos 5、地缘解读。https://pandaily.com/zhipu-ai-glm-5-dot-2-open-source-mit-jun2026 (英文)
- DataLearner《GLM 5.2:评测、参数、下载与模型卡》 — 发布时间 6-13、MIT 权重开源状态、GLM-5 系列局限性(长上下文幻觉/路由漂移/30–60 秒延迟)、GLM-5.1 参考成绩(SWE-Bench Pro 58.4 等)。https://www.datalearner.com/ai-models/pretrained-models/glm-5-2 (中文)
- SCMP《Zhipu AI's stock rockets after Chinese firm makes GLM-5.2 open source》(2026-06) — Coding Plan 定价为 Anthropic 高端套餐十分之一、发布后股价大涨。https://www.scmp.com/tech/tech-trends/article/3357115/ (英文,中译:《智谱开源 GLM-5.2 后股价飙升》)