SKILL.md(入口)+ references/(资料)+ 可执行脚本(工具)。SKILL.md(几百 tokens),需要细节再按需读 references/(几千 tokens)。所以你可以给 Agent 配很多技能,但上下文成本仍可控。Anthropic 在 2026-01-22 的这篇文章里,用一句话把他们的路线说透了:不要再把“代码”只当成一个用例,而要把它当成 Agent 的工作界面。
你可以把 Claude Code 想成一种“通用 Agent 的执行壳”:
过去我们喜欢“按领域造 Agent”:金融一个、市场一个、法务一个。Anthropic 说他们也这么想过,但后来发现,随着模型能力提升,这条路反而越走越重:不同 Agent 的工具、脚手架、状态管理、提示词体系都要重复造。
更轻的做法是:用一个通用 Agent + 代码执行环境承载能力,再用 Skills 承载经验。
这里他们用了一个比喻,我觉得很贴切:
你愿意让谁帮你报税?
多数人会选后者。原因很简单:会计的优势不在智商,而在经验。
今天的 Agent 很像数学天才:推理强、能举一反三,遇到真实工作却经常卡在三件事上:
所以问题不在“智商”,而在“职业训练”。Skills 想补的就是这块。
Anthropic 给的定义非常工程化:Skills 是一组文件的组织方式,用来打包领域专业知识。
它可以简单到只有一个入口文件,也可以复杂到带一堆脚本和参考资料。典型结构像这样:
anthropic_brand/
├── SKILL.md
├── docs.md
├── slide-decks.md
└── apply_template.py这里有个容易被忽略的点:Skill 的载体是文件。
这意味着它天然具备工程属性:
目录结构只是表象,真正让 Skills 变成“平台能力”的,是加载方式。
Anthropic 把它做成三层:
name/description,成本大概 ~50 tokens。它更像“路由表”,告诉模型“我会什么”。SKILL.md:当模型判断“需要这个 Skill”时才读取入口文件,成本大概 ~500 tokens。入口文件负责写清楚:流程、边界、验收方式。references/:需要更多细节时才按需读取,单个参考文件可能是 2000+ tokens,但不会常驻上下文。你可以用一张图理解它的运行方式:

工程含义很直接:技能规模可以很大,但常驻上下文仍然很轻。
description 不是简介,更像路由规则很多团队第一次写 Skill,最容易写废的地方是 description。
它更像一条路由规则,告诉模型两件事:
写法上有两个小技巧:
description。文章里举了一个很现实的例子:他们反复看到 Claude 写同一段脚本,用来把演示文稿套上 Anthropic 的模板。
与其每次都“让模型再写一遍”,不如把脚本保存下来,让 Agent 自己调用。
这一点我非常认同,因为它踩中了传统“工具化”的三个痛点:
脚本的好处是:可执行、可修改、可复用。模型从“重复劳动者”退回到“编排者”。
Anthropic 观察到 Skills 很快出现了三类生态:
他们还给了一个很有用的“复杂度刻度”:
我更关注的是这个趋势:Skill 会从“文档型知识”演进为“可执行工作流”。
这也是 MCP 发挥作用的地方。
如果把 Skills 看成“怎么做”,MCP 更像“去哪里拿数据、用什么外部工具”。
Anthropic 的例子是竞争分析:一个 Skill 可以编排 Web 搜索、内部数据库(通过 MCP)、Slack 历史、Notion 页面,最后汇总成一份结构化报告。
这里的分工很干净:
文章里提到他们在推进 Skills 标准化(agentskills.io),动机我理解主要是两点:
这件事如果真跑通,影响会比“又多了一套配置格式”大:它会把经验从“人脑”搬到“文件资产”,再从“单团队资产”搬到“生态资产”。
文章给出了一个四层架构,我建议每个做 Agent 工程的人都记住它:

这种分层的价值在于:每层都能独立演进。推理模型变强不影响 Skill 资产,MCP 更换供应商不影响流程结构。
如果你想在团队里用起来,我建议按“最小可用”做,不要一上来就想着搞一个“全能技能平台”。
优先挑这类:
信号也很简单:同一件事你们每周都在重复做,且每次都要“重新说明一遍怎么做”。
SKILL.md:只写入口,不写百科入口文件建议只放三件事:
一个很小的骨架示例:
---
name: incident-triage
description: 线上故障分级与排障流程。用于收集证据、定位根因、制定修复或回滚方案并输出复盘草稿。触发词:告警、线上故障、排障、root cause、回滚、复盘。
---
## 输入
- 业务影响描述、告警截图或日志链接、最近变更(commit、发布单)
## 流程
1) 收集证据:日志、指标、变更点
2) 缩小范围:时间窗口、组件边界、可疑变更
3) 给出处置:修复或回滚,明确验证步骤
4) 输出复盘草稿:时间线、根因、改进项
## 验收
- 给出可执行的验证命令或检查点
- 复盘草稿包含时间线与可追踪证据只要能脚本化,就别让模型“即兴发挥”:
模型更擅长的部分,是“编排”和“判断”:接到一个模糊请求,拆解成步骤,决定调用哪个脚本、读哪份资料。
Anthropic 提到一个细节:Skill 的贡献者正在从工程师扩展到产品、分析师、领域专家。他们甚至做了一个 skill-creator 工具,帮助人在 30 分钟内做出第一个可用 Skill。
你不一定要用他们的工具,但可以学这个思路:把“写 Skill”本身也做成一套模板。
比如约定每个 Skill 都带这些小段落:
技能库一旦开始增长,就会出现两类债务:
最小治理方式也很简单:
description 写清触发场景,避免重叠description 写成路由规则:触发场景 + 产出物SKILL.md 只写流程、边界、验收,细节拆进 references/references/,不要常驻上下文Skills 更像“把经验做成资产”,它不会替你解决所有问题:
我读完这篇文章最大的感受是:Anthropic 正在把 Agent 从“会聊天的模型”推向“可交付的工程系统”。
通用 Agent 负责能力上限,Skills 负责稳定性与可复制性。
如果你今天在做 Agent 产品或团队落地,我建议你至少试一次:选一个高频任务,把它从提示词里挪出来,做成一个小 Skill。等你做出 5 个,你会明显感觉到系统开始“长记性”。
https://claude.com/blog/building-agents-with-skills-equipping-agents-for-specialized-workhttps://claudecn.com/blog/claude-skills-new-paradigm-code-is-all-you-need/如喜欢本文,请点击右上角,把文章分享到朋友圈如有想了解学习的技术点,请留言给若飞安排分享
因公众号更改推送规则,请点“在看”并加“星标”第一时间获取精彩技术分享
·END·
相关阅读:
版权申明:内容来源网络,仅供学习研究,版权归原创者所有。如有侵权烦请告知,我们会立即删除并表示歉意。谢谢!
我们都是架构师!

关注架构师(JiaGouX),添加“星标”
获取每天技术干货,一起成为牛逼架构师
技术群请加若飞:1321113940 进架构师群
投稿、合作、版权等邮箱:admin@137x.com