2026 年 06 月 04 日decode

Anthropic 封了 832 个恶意账户，结论是：按"用了哪个产品"判威胁已经失灵

Anthropic 把 2025 年 3 月到 2026 年 3 月间因恶意网络活动被封的 832 个账户拉出来，逐个映射到安全行业的通用词典 MITRE ATT&CK，得出一个让整个甲方安全团队尴尬的结论：你过去用来区分"高危黑客"和"脚本小子"的那套标尺——他用了多少种技术、他调的是 Claude Code 还是 API 还是聊天界面——已经不再有效。原因只有一个：攻击者也在 agent 化。AI 不再只是帮黑客写一段恶意代码，而是开始编排整条攻击链，从踩点一直串到内网横向移动。

本期看点

MITRE ATT&CK —— 安全行业公认的"攻击战术与技术字典"，把一次入侵拆成侦察、初始访问、执行、横向移动等阶段，每个阶段下列举具体手法，让全世界的防御者用同一套词描述同一种攻击。
横向移动（lateral movement） —— 黑客攻进一台机器后，在内网里一台台往别的机器扩散、找更高权限的过程。它处在攻击链的中后段，技术含量比群发钓鱼邮件高得多。
攻击者 agent 化 —— AI 从"帮你写代码的助手"升级成"替你执行命令、做战术决策的自主智能体"，能把侦察、提权、窃凭据、横移这些原本要黑客手动串起来的步骤自己跑通。
风险评分（risk score） —— Anthropic 给每个被封账户打的危险分，本来想用技术数量、所用产品这类指标算，结果发现这些指标和真实危险程度对不上。

Anthropic 封了 832 个恶意账户，结论是：按"用了哪个产品"判威胁已经失灵配图 2

一、832 个账户，一张行业通用的地图

先把这件事的方法论说清楚，因为方法论本身就是判断的一部分。

Anthropic 没有按自己的产品口径(谁滥用了 Claude Code、谁滥用了 API)去归类这 832 个被封账户，而是把每一个都映射到 MITRE ATT&CK。这是一个存在多年的数据库，收录攻击者使用的战术(tactics)与技术(techniques)——通俗讲，它是安全圈的"普通话"：一次入侵被拆成侦察、初始访问、执行、横向移动等若干阶段，每个阶段下挂着一串具体手法。用它当坐标系，意味着 Anthropic 想回答的不是"我家产品被怎么滥用了"，而是"AI 正在改变攻击的哪个环节"。

这个选择本身是个信号。一家模型公司放下自家产品视角、改用行业框架来量自己被滥用的样本，等于承认：要看懂 AI 滥用，得站在攻击行为这一侧，而不是站在"我卖了什么"这一侧。

Anthropic 封了 832 个恶意账户，结论是：按"用了哪个产品"判威胁已经失灵配图 3

二、67.3% 写恶意软件，6.5% 做横向移动——结构比总量更重要

数字摆出来，结构一目了然。832 个账户里，**67.3%(560 个)**用 AI 来写恶意软件，这是绝对主力；**6.5%(54 个)**用 AI 做内网横向移动。

横向移动这个 6.5% 看起来小，但它是整组数据里最该警惕的一个。写恶意软件处在攻击链早段，本质还是"代码生成"这种 AI 最擅长、门槛最低的活；横向移动处在攻击链中后段，意味着黑客已经攻进来了、AI 正帮他在别人的内网里一台台机器往深处钻。能用上这个环节，说明 AI 已经不满足于当个写代码的助手，开始介入需要现场判断的脏活。

更能说明趋势的是六个月之间的位移。Anthropic 把一年切成前后两段对比：用 AI 做账户发现(account discovery，即在攻进来的网络里找还有哪些账号可以接管)的占比上升 8.9%，而用 AI 辅助钓鱼(phishing，即伪造邮件骗人点链接、交密码这种攻击链最前端的活)的占比下降 8.6%。

一升一降是同一件事的两面。钓鱼是攻击的入口动作，技术含量最低；账户发现是攻进来之后的纵深动作。占比从前者向后者迁移，数据表明 AI 滥用的重心正从"帮我敲开门"往"帮我在屋里翻箱倒柜"移动。攻击者不再主要拿 AI 干那些它本就能干的浅活，而是把它推向越来越深、越来越需要编排的环节。

Anthropic 封了 832 个恶意账户，结论是：按"用了哪个产品"判威胁已经失灵配图 4

三、半年里中高危占比从 33% 涨到 56%

如果说结构变化是慢镜头，那么风险等级的攀升就是快进。

Anthropic 给每个账户按危险程度分级。第一个六个月，被判为中危及以上的占 33%；第二个六个月，这个数字涨到 56%——官方的说法是"大约 1.7 倍的增长"。半年时间，恶意账户里"值得认真对付的"那一半，从三分之一变成了过半。

这条曲线之所以陡，恰恰因为门槛在塌。当 AI 能替攻击者完成高技术含量的任务，普通人也能跑出过去只有老练黑客才能完成的操作。危险不再集中在少数高手身上，而是均匀地铺给了所有拿到 AI 的人。

Anthropic 封了 832 个恶意账户，结论是：按"用了哪个产品"判威胁已经失灵配图 5

四、为什么"数技术、看产品"两个老标尺都废了

这才是这份报告真正的刀。Anthropic 直接点名两个安全行业沿用已久的危险度判据，说它们都失效了。

第一个失效的是"数技术数量"。直觉上，一个黑客会的招越多越危险。但数据对不上：技术最少的那批攻击者平均用约 16 种不同技术，技术最多的那批也只有约 20 种——差距小得可怜。Anthropic 的原话是："现在 AI 能替攻击者执行高技术含量的任务，威胁者的真实水平和他用了多少种技术之间，已经几乎没有相关性。"换句话说，技术数量从前是能力的代理指标，现在 AI 把这个代理关系打断了——招式是 AI 现学现卖的，数得清招数也量不出人的危险。

第二个失效的是"看用了哪个产品"。攻击者用的是 Claude Code、是 API、还是聊天界面，与他的风险等级同样毫无相关。这一刀砍向的是很多平台默认的风控逻辑：以为按产品形态(给开发者的 vs 给普通人的)就能粗筛威胁。实际上同一个危险攻击者在三种界面里都能干同样的坏事，产品门类拦不住行为。

两把老标尺一起失灵，指向同一个根因：被量的对象变了。过去量的是"人"——人的技术储备、人选的工具；现在该量的是"行为编排"——AI 把多少个攻击环节自动串成了一条链。

Anthropic 封了 832 个恶意账户，结论是：按"用了哪个产品"判威胁已经失灵配图 6

五、连 ATT&CK 这本字典都还没收录这种行为

最后一击落在框架本身。Anthropic 说，让 AI 时代攻击者最危险的那些行为，MITRE ATT&CK 至今还没把它们当作攻击者技术收录进去。

最锋利的证据是 2025 年 11 月那起国家级间谍攻击。在那次行动里，模型"作为自主智能体运行：它执行命令、利用漏洞、窃取凭据、做出战术决策，只在少数几个关键节点需要人类介入"。这是教科书级的"攻击者 agent 化"——人退到幕后只按几个确认键，AI 跑完了大半条攻击链。

可是用 ATT&CK 去量它，结果很反常：这次攻击落在 30 种技术、13 个战术上，"与我们数据集里许多中危攻击者相当"——按技术铺开的广度看，它平平无奇。但按 Anthropic 的风险评分方法论算，它拿到了满分 100。一个真实危险度顶格的攻击，在通用字典里却长得像个中等水平的对手，因为字典里压根没有"自主编排"这个词条。Anthropic 已经在和 MITRE 讨论这套框架该怎么演进。

判断到这里收口：威胁的危险来源已经从"会哪些招"迁移到"AI 替它编排了多少",而行业用来描述攻击的那本公共字典,还停留在数招式的旧范式里。字典没更新，所有依赖它的防御打分、威胁情报、自动告警，都在用一把量不准的尺。

对从业者意味着什么

对安全团队(蓝队/SOC)：把危险度判据从"用量与门类"换成"行为编排"。不要再用"这个账号调用了多少种工具""他走的是开发者接口还是普通接口"来分流告警——这两条 Anthropic 已经证明和真实危险无关。该盯的是攻击链上多个环节是否被自动地串起来：一个会话里先侦察、再提权、又横移、还窃凭据，这种跨阶段的连贯编排才是 agent 化攻击的指纹，哪怕它用到的"招式"总数并不多。同时别再把 ATT&CK 的覆盖度当成完备清单，框架本身已落后于自主编排这一类行为，依赖它做基线的检测规则要预留盲区。

对模型平台与做 AI 风控的人：防御也得 agent 化。攻击侧已经把多个步骤交给自主智能体串联，靠人工审一条条调用记录的速度追不上。监测维度要从"单次调用是否违规"升级到"一连串调用是否在拼一条攻击链"——按行为序列而非按单点用量来识别。Anthropic 自己的态度也明确：它把这次数据、把 Project Glasswing 的发现公开出来，是想"让防御者先拿到最强工具"。这句话对所有平台都是提醒——攻防节奏正被 AI 同步抬高，防御侧若还停在"人审用量"的范式，差距只会被拉开。

引用

Anthropic，《AI 赋能的网络威胁：来自我们对 MITRE ATT&CK 分析的关键发现》(AI-Enabled Cyber Threats: Key Findings from Our MITRE ATT&CK Analysis)：https://www.anthropic.com/news/AI-enabled-cyber-threats-mitre-attack