苹果交了一份"体面认输"——对消费者说"自主要慢",对开发者说"自主跑久一点"
苹果交了一份"体面认输"——对消费者说"自主要慢",对开发者说"自主跑久一点"

本期关键词:体面认输(苹果放弃全自研前沿模型、改蒸馏 Gemini,被中文媒体称作一次有体面的认输)/ 蒸馏(distillation,用一个强模型的输出当老师,训练自己的小模型,不在运行时调用那个强模型)/ MCP(Model Context Protocol,模型上下文协议,让 agent 用统一接口接外部工具和数据)
2026 年 6 月 8 日,Tim Cook 任内的最后一场 WWDC 开幕主题演讲。会上宣布 John Ternus 接任 CEO,没有一件新硬件,AI 占了绝大部分篇幅,操作系统集体跳号到 27——iOS 27、macOS 27 代号"Golden Gate"。一家市值四万亿美元、向来以"自己造每一块砖"著称的公司,在这场发布会上做了两件方向完全相反的事。
对几亿普通用户,它把重建后的 Siri 的自主性拴到了全行业最短的那一档——能读屏、能跨邮件照片调用你的个人信息、能在系统层替你点几下 app,但就是不替你做开放式的任务。The Verge 上手后的原话是"它可不会跑出去帮你点外卖"。与此同时,苹果悄悄放弃了"自研最强前沿模型"这个坚持了两年的野心:云端最强的那个模型,是拿 Google 的 Gemini 当老师蒸馏出来的,跑在 Google 云里租来的英伟达 GPU 上。
但对开发者,同一家公司在同一天把闸门全开:Xcode 27 把 Anthropic、Google、OpenAI 的 agent 直接请进 IDE,原生支持 MCP,让 agent "更长时间自主运行"。
一家公司,对消费者说"自主要慢、要克制",对开发者说"来,多模型、自主跑久一点"。这不是精神分裂。这是苹果对"agent 该有多自主"给出的双轨答案,也是它用行动发给全行业的一个信号。这篇就把这份答卷拆开。
一、一场"体面认输":放弃了坚持两年的全自研野心
先把判断给足:这场发布会最大的新闻不是 Siri 终于能用了,是苹果放弃了一件它过去咬死不放的事——自己训练出最强的那个模型。
证据在苹果自己的机器学习研究页里。新的 Apple Foundation Models 第三代,端侧是一个 30 亿参数(3B)的小模型,云端是一个 200 亿参数(20B)的稀疏模型。稀疏的意思是,虽然总盘子 20B,但每次回答只点亮其中 1B 到 4B(苹果管这套叫 Instruction-Following Pruning,按指令裁剪)。这些都是苹果自己的活。但最关键的一句藏在云端那个 AFM 3 Cloud Pro 的描述里:它是用 Gemini 前沿模型的输出做蒸馏训练的,而且跑在租自 Google 云的英伟达 GPU上。
"为 Apple Silicon 定制构建,用专有数据训练,并用 Gemini 前沿模型的输出来打磨。" ——Apple AI 副总裁 Amar Subramanya 来源:https://machinelearning.apple.com/research/introducing-third-generation-of-apple-foundation-models
翻译成大白话:苹果不再试图从零训出一个能跟 GPT、Gemini 掰手腕的最强模型。它找了个更强的当老师,把老师的本事"蒸"进自己的小模型里,自己只负责把它塞进 iPhone、做隐私、做产品。这就是中文媒体抓住的那个词。钛媒体的标题直接叫《苹果的一次体面认输》,副题"没有惊喜,只有追赶";36 氪更不留情面,《苹果的 AI,依然是个笑话》。
市场用真金白银投了票。当天股价盘中一度冲到约 317.40 美元的历史高位,收盘却跌回 301.54,下跌 1.89%——盘中高点到收盘,蒸发了大约 2200 亿美元市值。这不是一次普通的"利好出尽"。背景是苹果的 AI 已经欠了一笔债:此前 Apple Intelligence 大规模跳票,苹果刚为一桩虚假宣传的集体诉讼掏了 2.5 亿美元和解。市场看的不是"这次发布会好不好",是"两年了,苹果到底追上没有"。
为什么说这份认输"体面"?因为它不是认怂,是止损。苹果想清楚了一件很多公司还没想清楚的事:在 2026 年,自己从头训一个前沿基座模型,投入产出比已经不划算了——尤其当你的核心优势根本不在模型本身,而在那十几亿台设备、在端侧隐私、在 App 生态。把训练前沿模型这件最烧钱、自己又不占优的事外包给"蒸馏",省下的力气全押在自己真正护得住的地方。这是一个垂直整合巨头罕见地承认"有件事我不自己干了"。问题只在于,它认得不够痛快——一边蒸馏 Gemini,一边台上还要嘴硬。这个拧巴,下一节拆。

二、Siri 真能用了,但苹果刻意把它做成最不自主的那个
第二个判断更反直觉:Siri 这次确实脱胎换骨真能用了,但苹果是故意把它做成了全行业自主性最低的助手——而且这是战略,不是技术不行。
先说它有多强。重建后的 Siri 做到了几件过去做不到的事:能读屏幕上的内容、能跨你的邮件和照片调用个人上下文去搜信息(比如"找我妈上次发我的那个地址")、能在系统层替你操作 app,还独立成了一个像 ChatGPT 那样可以连续对话的 app,聊天记录还能 iCloud 同步。公测要等今年晚些时候,英文先行,秋季全量。听起来,这是一个标准的 agent 雏形。
但 The Verge 的上手评测一句话点破了苹果的取舍:
"这就是'婴儿的第一个 AI 助手'水平,但它真能用,这本身就很重要……它可不会跑出去帮你点外卖。" 来源:https://www.theverge.com/tech/947432/siri-ai-apple-intelligence-ios-27-wwdc
同一篇评测的另一句判断更直接:"AI Siri 这次是真的。"两句合起来,意思很清楚:能用,但被刻意限制在"读、查、点几下"的范围里,不做开放式的、跨 app 自己跑一长串的任务执行。
对照一下就知道这是选择不是能力。Google 的 Gemini 在安卓上早就在做开放式任务执行,帮你订、帮你查、帮你跨应用串流程。苹果手里同样有读屏、有 App Intents、有系统级权限,完全有能力把 Siri 也做成"帮你点外卖"的那种。它偏不。Federighi 在台上把这种"慢"直接讲成了价值观,还顺手"阴阳"了一把同行:
"有些人看起来在一路狂奔,像是为了 AI 而 AI,并不真正顾及它本该服务的人——我们所有人。我们相信,真正有用的 AI 必须围绕你和你的需求。" ——Craig Federighi 来源:https://www.theverge.com/tech/942416/apple-siri-ai-update-wwdc
把这句话翻译成产品决策:苹果赌的是,对几亿不懂技术、也不愿意承担风险的普通人,一个"能 ship、可信赖、出错代价小"的窄助手,比一个"什么都敢替你干、但偶尔把事办砸"的宽 agent 更值钱。一个会自作主张帮你下单、改日程、发消息的助手,只要错一次——订错餐、发错人、改错会议——用户的信任就崩了。苹果把 Siri 的自主性焊死在一个小范围里,本质是把"自主性"这个旋钮,替几亿不会自己调的人,预先拧到了最保守的那一档。
这里还有个容易被当成段子、其实是证据的细节。keynote 上 Siri 的演示有好几秒的明显延迟,9to5Mac 把这评为"算是好消息"——因为这个卡顿说明那是真实、未剪辑的端侧或私有云计算(PCC)在现场跑,不是录播糊弄。慢,反而证明了真。这跟苹果整个姿态是一致的:不追求"看起来很神",追求"真的在你设备上、真的护着你的隐私、真的能用"。
所以别把"不帮你点外卖"读成苹果做不到。读成苹果想清楚了:在消费端,最短的自主性,就是最强的产品。

三、蒸馏 Gemini 的真相:老师 ≠ 司机,别被混乱报道带偏
这一节是全篇最该咬死的地方,因为它是这次发布会被传得最乱的一个点。很多报道把"苹果用 Gemini"写成了"苹果的 Siri 背后是 Gemini 在跑",甚至联想到此前传过的"苹果要付 Google 钱用 Gemini 给 Siri 当大脑"。这是错的。必须把两件事掰开。
蒸馏(distillation)里的 Gemini,是老师,不是司机。 蒸馏是机器学习里一个成熟做法:拿一个很强的大模型(老师),让它对海量问题生成高质量答案,再用这些"老师的答卷"去训练你自己那个更小的模型(学生)。训练完成后,学生独立工作,老师就退场了——运行时,你设备上、你云里跑的,是苹果自己那个学生模型,Gemini 一个字都不参与。老师只在"上课"阶段出现,不在"考试"阶段出现。
苹果自己把这条界线划得非常清楚。Federighi 在采访里被追问跟 Google 的关系,回答很硬:
"我们用到的 Google Assistant 的量,是零。" ——Craig Federighi 来源:https://www.theverge.com/tech/942416/apple-siri-ai-update-wwdc
Subramanya 的措辞前面引过,这里再对照一次它的精确度:模型是"为 Apple Silicon 定制构建,用专有数据训练,并用 Gemini 前沿模型的输出来打磨"。注意"输出"(outputs)这个词——苹果用的是 Gemini 的输出(也就是老师写的答案)来打磨,不是把 Gemini 这个模型本身接进 Siri。runtime(运行时,即真正给你干活那一刻)跑的,是苹果的 AFM 3,不是 Gemini。
为什么这个区别要紧到值得单开一节?因为它直接决定你怎么判断苹果这步棋。如果是"Siri 背后跑 Gemini",那叙事是"苹果连模型都要靠 Google,彻底投降";如果是"蒸馏 Gemini 训自己的模型",那叙事是"苹果把'造老师'这件不划算的事外包了,但司机还是自己,方向盘和隐私还攥在自己手里"。前者是缴械,后者是止损。事实是后者。
把这层说穿,前面那句"体面认输"才站得住:苹果认输的是"自己训出最强老师"这件事,没认输的是"谁来给你干活、谁来管你的数据"。它把最烧钱、自己又不占优的环节(训前沿基座)让出去,把自己真正护得住的环节(端侧、隐私、产品、分发)攥得更紧。这也呼应了前面的拧巴:Federighi 嘴上说"Google 的量是零"是为了撇清"司机"的嫌疑,技术上完全成立;但苹果终究是站在 Gemini 这个老师的肩膀上才追上来的,这口气咽得并不轻松。所以是"体面",但终归是"认输"。
(顺便堵一个坑:网上有"苹果模型自研成功率 60-80%"这类说法在流传,查下来没有一手出处,属于二手脑补,本文不采用。判断只建立在苹果官方研究页和高管原话上。)

四、反讽:消费端焊死,开发端全放开
现在是全篇的转折,也是这份答卷最值得玩味的地方。同一场发布会、同一家公司,在另一扇门后,把消费端死死焊住的那个自主性旋钮,对开发者整个拧开了。
证据在 Xcode 27 和那套新开发者框架里,一条一条摆:
第一,把别家的 agent 请进自己的 IDE。 Xcode 27 的 agentic coding(智能体编程)直接接入了 Anthropic、Google、OpenAI 的 agent。官方对这些 agent 的描述,跟苹果在消费端的克制形成了刺眼的对比:
"(让 agent 能够)验证自己的工作,从而能更长时间地自主运行。" 来源:https://www.apple.com/newsroom/2026/06/apple-aids-app-development-with-new-intelligence-frameworks-and-advanced-tools/
"更长时间地自主运行"(run autonomously for longer)——这正是 Cursor、Codex 这一周都在追的方向:让 agent 闭合"自己写、自己测、自己验证"的循环,从而把人工盯着的环节拿掉,把自主时长拉长。苹果在消费端连"帮你点个外卖"都不肯,在开发端却主动给 agent 装上"自己验证、自己跑更久"的能力。
第二,原生支持开放协议,而且是多供应商。 Xcode 27 原生支持 MCP(模型上下文协议) 和 Agent Client Protocol,首批接入 GitHub 和 Figma。Foundation Models 框架允许开发者调用苹果自己的模型,也可以调 Claude、Gemini、或任何实现了该协议的模型。Core AI 还能在本地跑开源模型,比如 Qwen、Mistral。这是一种彻底的开放姿态:苹果不要求开发者只用苹果的 AI,它把自己的 IDE 做成一个谁都能接的转接口。
第三,把第三方 app 接进 Siri 的动作体系。 App Intents 让第三方 app 把自己的功能暴露给 Siri 调用。也就是说,消费端那个"不帮你点外卖"的窄 Siri,苹果留了一条路:外卖这件事它自己不做,但它把接口开给外卖 app,让生态去填——自主性不由苹果一家来给,而是分发给开发者。
把这三条和第二节的"焊死"并排看,反讽就立住了:面向几亿不懂技术的人,苹果把 agent 的自主性焊死在一个能 ship、可信赖的小范围里;面向开发者,它承认 agent + MCP + 多供应商这套栈,就是 2026 年的事实标准,该放开就放开。
这才是苹果这份答卷真正的判断,藏在产品决策里,比台上任何一句话都重:连最垂直整合、最爱自己造一切的公司,都认了——前沿模型是可以租来、可以蒸馏的输入,不是护城河。 模型这一层正在商品化(变成像电、像云一样可采购的标准件)。苹果于是把自己从"模型竞赛的选手",重新定位成模型之上的那一层:分发(十几亿台设备)、隐私(端侧 + PCC)、编排(谁来调用哪个模型、按什么权限、给谁干活)。这恰恰是墙外、是任何不打算自己烧钱训基座的团队,还能下场竞争的那一层。

五、对从业者意味着什么
把这份答卷收成几条能落地的判断。
1. 别再把"自研前沿模型"当成默认选项——先问自己占不占那个优。 苹果这种体量、这种垂直整合,都算清账放弃了从零训基座,改蒸馏 + 租算力。对绝大多数公司,这个信号更直接:前沿基座模型正在变成可采购的标准件,你真正的护城河大概率不在模型层,而在数据、分发、垂直场景、合规。把训模型的钱省下来,押在你真正护得住的地方。蒸馏(用强模型的输出训自己的小模型)是一条被苹果背书的务实路线,值得认真评估。
2. 自主性是给不同用户分档的,不是一个全局开关。 苹果同一家公司,给消费者和开发者拧了完全不同的两档。这对任何做 AI 产品的人都是模板:面向不承担风险、不会自己调参的大众用户,默认档要保守——宁可少帮一点,也别错一次砸了信任;面向能为自己的爆炸半径负责的专业用户,把旋钮交出去让他自己拧。"一个产品一档自主性"是偷懒,按用户分层预设自主性才是产品。
3. 接 MCP,别只接一家模型。 苹果——那个最有理由把开发者锁进自家生态的公司——都在 Xcode 27 原生支持 MCP、放开多供应商(Claude/Gemini/本地开源任选)。这等于头部玩家给"开放协议 + 多模型可插拔"盖了章。你在设计自己的 AI 栈时,把模型当成可替换的后端、用 MCP 这类标准协议接工具和数据,而不是和某一家模型 API 焊死,是更安全的架构选择。
4. 把"慢"和"认输"分开看,别跟着情绪走。 中文媒体判"笑话""认输",西方上手判"这次是真的",慢 demo 反证了端侧真在跑。同一件事,站用户端看是"追赶者",站架构端看是"务实止损"。判断一家公司的 AI 走向,别只看发布会燃不燃,看它把力气押在哪一层——苹果押在分发、隐私、编排,这恰好是模型商品化之后还守得住的地方。这套打法,墙外团队同样能用。

引用与信源
- 苹果 WWDC26 官方 newsroom(Apple Intelligence / Siri AI,2026-06-08,Tim Cook 任内末场、John Ternus 接任、OS 跳号 27):https://www.apple.com/newsroom/2026/06/apple-unveils-next-generation-of-apple-intelligence-siri-ai-and-more/
- 苹果开发者框架官方 newsroom(Xcode 27 agentic coding / MCP / Agent Client Protocol / Foundation Models 框架 / Core AI 本地开源):https://www.apple.com/newsroom/2026/06/apple-aids-app-development-with-new-intelligence-frameworks-and-advanced-tools/
- The Verge 上手 Siri AI(2026-06-08,"婴儿的第一个 AI 助手……不会帮你点外卖""AI Siri 这次是真的"):https://www.theverge.com/tech/947432/siri-ai-apple-intelligence-ios-27-wwdc
- The Verge:Federighi 谈 Siri / 与 Google 关系("我们用到的 Google Assistant 的量是零"、台上"阴阳"对手原话):https://www.theverge.com/tech/942416/apple-siri-ai-update-wwdc
- 苹果机器学习研究:Apple Foundation Models 第三代(端侧 3B + 20B 稀疏 / Instruction-Following Pruning / Cloud Pro 蒸馏 Gemini 输出 / NVIDIA-on-GCP / Subramanya 原话):https://machinelearning.apple.com/research/introducing-third-generation-of-apple-foundation-models
- Apple Foundation Models 3 开发者视角解读:https://ofox.ai/blog/apple-foundation-models-3-wwdc-2026-developer-read/
- 钛媒体《苹果的一次体面认输:没有惊喜,只有追赶》:https://www.tmtpost.com/8021379.html
- 36 氪《苹果的 AI,依然是个笑话》:https://36kr.com/p/3845807309916420