· AI Force 情报组brief
AI 情报日报 2026-05-12|Agent 平台战开始换挡
Claude CodeAnthropicCodexOpenAIAgentMCPfinancial-services
AI 情报日报 2026-05-12
三条消息连在一起看,今天的关键词不是模型能力,而是工作入口。
Claude Code 在补多任务调度,Anthropic 在铺金融行业模板,OpenAI 在把 Codex 接回自己的开发者 API。Agent 平台战开始换挡:谁能让 AI 真正进入人的工作台、行业流程和 API 生态,谁才有机会吃到下一层增长。
今日要点
1. Claude Code 2.1.139:从聊天窗口,变成多 Agent 调度台
- 一句话:Anthropic 在 Claude Code
v2.1.139里加入agent viewResearch Preview。用户运行claude agents后,可以在一个列表里看所有 Claude Code session:运行中、等人处理、已经完成。版本同时加入/goal,让用户设定完成条件,Claude 跨多轮继续推进,直到目标满足。 - 为什么重要:这不是一个普通 UI 更新。Claude Code 正在把使用方式从“盯着一个对话框催它干活”,推到“给多个后台任务排队、观察、接管”。
agent view解决横向并发,/goal解决纵向续航。AI coding 的下一道门槛,不是让模型再聪明一点,而是让任务能被组织起来。 - 信源:Claude Code GitHub release、Claude Code agent view / goal 官方文档
2. Anthropic 金融仓库:不是 demo,是行业样板间
- 一句话:凡人小北在 X 上转述 Anthropic 金融服务仓库时,用了一句很准的概括:“我正在金融街。”这个仓库不是单个示例,而是一套金融服务参考工程:投行、股票研究、私募、财富管理、基金运营、KYC 等工作流,都有对应 agent、skills、commands 和 MCP 数据连接器。
- 为什么重要:企业 AI 最难的一步不是会不会调用模型,而是把模型嵌进行业流程。Anthropic 这次给出的不是抽象方法论,而是可复制的文件结构:agent、skill、command、connector、Managed Agents 部署、Microsoft 365 安装工具。它等于把金融行业的“第一版 AI 工作台”直接摆到桌面上。真正的壁垒不在 prompt,而在行业流程被谁先格式化。
- 信源:frxiaobei X 帖、Anthropic
financial-servicesGitHub 仓库
3. OpenAI Developers plugin:Codex 开始回流 API 生态
- 一句话:OpenAI Developers 官方账号宣布,Codex 现在可以通过 OpenAI Developers plugin,帮助用户更快构建基于 OpenAI API 的 AI 应用和 agents。官方帖本身很短,但信号很直接:Codex 不只是写代码,它开始成为 OpenAI 平台开发的入口。
- 为什么重要:OpenAI 的优势不是单点工具,而是 API、模型、文档、示例、开发者关系和 Codex 的闭环。把 OpenAI Developers plugin 放进 Codex,相当于把“查文档、选 API、写样例、调试 agent”压到同一个工作界面里。对开发者来说,这会减少从文档页到编辑器再到终端的来回切换;对 OpenAI 来说,Codex 正在变成 API 消费的前台。
- 信源:OpenAI Developers 官方 X 帖
值得关注
- Claude Code 的
agent view仍是 Research Preview,适合重度用户试用,不适合把关键生产流程完全压上去。 - Anthropic 金融仓库的强处是结构完整,盲区是合规责任。README 明确说输出需要 qualified professional 审核,不构成投资、法律、税务或会计建议。
- OpenAI Developers plugin 目前只从官方 X 帖确认到能力方向,具体能覆盖哪些 API、示例和调试流程,还需要等官方文档或插件详情补齐。
对从业者意味着什么
- PM:本周可以把团队里最常见的 AI 工作流拆成三层:入口、任务状态、完成条件。只写 prompt 的需求文档已经不够了。
- 架构师:本周可以检查内部 agent 框架有没有任务可观测性。没有 session 状态、阻塞原因和完成条件,长任务会变成黑箱。
- CTO:本周可以看一眼 Anthropic 金融仓库的目录结构。它不是为了照抄金融流程,而是展示了行业 agent 模板应该怎么包装成可部署资产。
- 开发者:本周可以试一次
claude agents和/goal。重点不是新鲜感,而是判断哪些任务适合并发,哪些任务必须继续人工盯。
关键词
- 调度台:从单个聊天窗口升级成多个任务的管理界面。Agent 真正进入工作流后,用户关心的不只是“回答是什么”,还包括谁在跑、卡在哪、什么时候能接管。
- 完成条件:用户预先定义任务什么时候算结束。它把“继续做”这种模糊催促,改成可以被系统检查的目标,比如测试通过、文件生成、错误清零。
- 行业样板间:厂商把一个行业的典型流程打包成参考 agent、技能、命令和连接器。它不是最终方案,但会成为客户和集成商开工时的默认起点。
- API 前台:Codex 这类 coding agent 逐渐承担 API 平台的入口角色。开发者不再先读十页文档,而是在编码环境里直接获得示例、调用方式和调试路径。