Addy Skills 详细教程:把 AI 编程从“瞎写”拉回工程化流程
先说结论:Addy Osmani 这套 Agent Skills,真正厉害的地方不是又造了一套提示词,而是把资深工程师做项目时那套“先定义、再拆解、边做边验、上线前复核”的流程,打包成了 AI coding agent 能稳定执行的工作流。
很多人现在用 Claude Code、Codex、Gemini CLI、Cursor 写代码,最大的问题不是模型不够强,而是过程太飘:需求没讲清、上下文喂不全、一下子让模型改太多、做完也不验证。最后看起来写得挺快,实际上返工更多。
Addy Osmani 开源的 Agent Skills,正好就是冲着这件事来的:它不想让 AI 只会“接单吐代码”,而是逼着 agent 按工程化节奏做事。你可以把它理解成一套给 AI 编程助手上的“流程护栏”。这玩意儿最近能火,不是没道理。
一、Addy Skills 到底是啥?
它的 GitHub 仓库名叫 agent-skills,定位很直接:Production-grade engineering skills for AI coding agents。意思就是,这不是给人看的教程型文档,而是一套给 AI coding agent 用的工程技能包。
它把完整开发流程拆成了 6 个阶段:
- Define:先把要做啥定义明白
- Plan:把任务拆小
- Build:增量实现
- Verify:测试和调试
- Review:质量审查
- Ship:上线交付
对应到仓库里,就是一组 slash commands:
/spec/plan/build/test/review/code-simplify/ship
这套设计的核心思想很像一句大白话:别让 AI 直接开干,先让它像个靠谱工程师一样走流程。
二、它和普通 Prompt 最大的区别在哪?
很多人一听“skills”,第一反应是:哦,不就是高级提示词么?
还真不是。
普通 Prompt 更像一次性口头指令,比如“帮我写个登录页,React + Tailwind,顺便加测试”。看着挺完整,但 AI 还是容易偷懒,尤其在这些地方最容易翻车:
- 跳过需求澄清
- 直接写大块代码
- 测试只写样子,不真跑
- 改了一堆文件但没有验证边界
- 输出像能跑,实际上项目一接就碎
Addy Skills 的思路是:把流程写死,把验证前置,把常见偷懒借口也提前堵住。
每个 skill 基本都不是“知识说明书”,而是一个完整工作单元,通常包含这些部分:
- 什么时候用
- 一步一步怎么做
- 常见偷懒理由与反驳
- 哪些迹象说明你已经跑偏了
- 最后必须拿什么证据证明做完了
这点特别关键。因为 AI 最大的问题,往往不是不会,而是会在你没盯住的时候瞎省步骤。Addy 这套 skills,本质上就是给 agent 上了个“别糊弄”的制度。
三、为什么它最近一下子火了?
这波 Agent Skills 走红,背后其实踩中了 2025 到 2026 年 AI 编程最真实的痛点。
Addy 自己在《My LLM coding workflow going into 2026》里总结得很明确:AI coding assistant 已经足够强,但真正把它用好,并不是“说一句需求就自动完工”,而是要学会新的工作方式。
他说的几个核心点,和 Agent Skills 是完全对齐的:
1)先做 spec,再写代码
这是最关键的一步。
很多人直接一句“做个 xx 功能”,模型当然也会给你吐出一坨代码,但因为目标不清、边界没定、约束没说,后面一定返工。
Addy 的做法是:
- 先和 AI 一起把问题问清楚
- 再整理成 spec.md
- 再生成 plan
- 然后才进入实现
这也是为什么仓库里 /spec 和 /plan 被放在最前面。它不是仪式感,而是为了压返工率。
2)任务必须拆小,不能一把梭
这是另一个特别实用的原则。
Agent 最怕大而全的任务。你一下子让它改十几个模块、补一堆逻辑、顺便重构,最后产出的代码经常像“十个程序员各写各的,谁也没对齐”。
所以 Addy Skills 非常强调:
- 小步推进
- 一次只做一个明确切片
- 做完就验证
- 再进入下一步
说白了,Agent 也得吃切片任务,不能硬塞满汉全席。
3)上下文工程比模型名字更重要
很多人纠结 Claude、GPT、Gemini 谁更强,但在真实项目里,往往更重要的是:你到底给了模型多少正确上下文。
Addy 在文章里提到一个很重要的方向叫 context packing:
- 把相关代码喂进去
- 把约束喂进去
- 把项目规则喂进去
- 把官方文档喂进去
- 把哪些方案不能用也提前说清楚
Agent Skills 里也有专门的 context-engineering。这说明它不是只关心“怎么写代码”,而是关心“怎么让 AI 在正确语境下写代码”。
四、仓库到底包含什么?
根据仓库 README,这套技能包目前围绕完整软件生命周期组织,核心是一组约 20 个 skills,外加 agent persona、参考清单和 setup 文档。
可以简单理解成四层:
第一层:流程入口命令
这层最适合新手直接上手:
| 你在干什么 | 对应命令 | 核心原则 |
|---|---|---|
| 定义要做什么 | /spec |
先规格,后代码 |
| 规划怎么做 | /plan |
拆成小任务 |
| 开始实现 | /build |
一次一个切片 |
| 验证结果 | /test |
测试是证据 |
| 上线前审查 | /review |
代码质量要过关 |
| 做代码简化 | /code-simplify |
清晰比炫技重要 |
| 准备发布 | /ship |
越快上线越要可控 |
第二层:核心技能模块
比如这些就特别有代表性:
spec-driven-developmentplanning-and-task-breakdownincremental-implementationtest-driven-developmentcontext-engineeringsource-driven-developmentapi-and-interface-designdebugging-and-error-recoverycode-review-and-qualitysecurity-and-hardeningshipping-and-launch
这套名字起得都很直白,基本一看就知道解决什么问题。
第三层:专用角色 Agent
仓库里还有 3 个预设角色:
code-reviewertest-engineersecurity-auditor
这个思路挺聪明:同一个 coding agent,在不同阶段切不同“审视视角”。
比如写完功能,不是继续让它以“实现者”心态自我欣赏,而是切换成 reviewer、QA、security auditor 去挑毛病。这个比一句泛泛的“你再检查一下”靠谱得多。
第四层:参考清单
仓库还给了测试、安全、性能、可访问性这些 checklist。
这意味着它不是只讲原则,而是尽量把“工程经验怎么被复用”也一起打包了。
五、怎么安装和接入?
这一块其实比想象中简单,因为它本质上就是 Markdown 技能文件,不依赖什么神秘闭源协议。
Claude Code
这是官方 README 里最推荐的方式。可以通过 marketplace 安装,也可以本地 clone 后作为 plugin-dir 使用。
适合人群:
- 已经在用 Claude Code
- 想把技能自动接进工作流
- 希望 slash command 直接可用
Cursor
思路是把相关 SKILL.md 放进 .cursor/rules/,或者直接引用整个 skills/ 目录。
适合人群:
- 已经在 Cursor 里长期写项目
- 想把某些技能变成团队规则
Gemini CLI / Codex / 其他 Agent
通用 getting started 文档里写得很清楚:只要你的 agent 支持 Markdown 指令或规则文件,就能用。
也就是说,它不是绑死在某家工具链上的。
这个开放性其实很重要。因为现在 AI coding 工具更新太快了,今天火的是这个,明天可能又换。把 skill 写成通用 Markdown,本质上是在押注一种更长寿的资产:流程经验可以迁移,具体工具会不断变化。
六、最适合什么人用?
说实话,它不是给所有人准备的。
如果你现在还只是偶尔让 AI 帮你写个函数、补点样板代码,那你未必会立刻感受到这套 skills 的价值。
但下面几类人,我觉得会很吃这一套:
1)已经深度用 AI 写代码的人
你越频繁用 Claude Code、Codex、Gemini CLI、Cursor 这类工具,就越容易碰到“模型挺聪明,但老在流程上偷工减料”的问题。
这时候,Agent Skills 的价值就很明显:它不是提升天赋上限,而是提高稳定性下限。
2)带团队的人
如果团队里很多人开始用 AI 辅助开发,最怕的不是“不会用”,而是“每个人用法都不一样”。
有人直接让模型瞎写,有人认真写 spec,有人写完从不测。时间一长,团队输出质量会越来越分裂。
这时候,把 Agent Skills 当成团队共同工作协议,其实很合适。它相当于给 AI 协作补了一层流程标准化。
3)想从“vibe coding”往工程化走的人
很多人已经意识到,光靠 vibe coding 做 demo 很爽,但一旦上到真实项目,就会发现维护、复盘、交接、排错都很痛苦。
Addy 这套东西,本质上就是从“随缘写”往“工程化交付”挪一步。
七、上手建议:别一口气全装
这点我特别想强调。
getting-started 文档里其实已经提醒了:不要一上来把所有 skills 全塞进上下文。
为什么?因为上下文不是越多越好。塞太满,反而会让 agent 判断迟钝、重点模糊。
更合理的上手顺序,我建议这样:
第一阶段:先装 3 个基础技能
最值得优先上的,就是这 3 个:
spec-driven-developmenttest-driven-developmentcode-review-and-quality
原因很简单:
- 一个负责别乱开工
- 一个负责别瞎写完不测
- 一个负责别自我感觉良好就交付
这三个已经能解决大多数 AI coding 场景里最常见的翻车点。
第二阶段:按场景加载专项技能
比如:
- 做前端,就加
frontend-ui-engineering - 查 bug,就加
debugging-and-error-recovery - 接新框架,就加
source-driven-development - 改接口,就加
api-and-interface-design - 准备上线,就加
shipping-and-launch
这个思路非常像工具箱:不是把所有工具背在身上,而是干啥拿啥。
第三阶段:把技能融入你现有流程
真正高级的玩法,不是“我今天试了个新 skill”,而是把它融进日常:
- 新需求默认先
/spec - 复杂功能默认先
/plan - 大一点的改动按
incremental-implementation切片推进 - 每次交付前走一次
review
当它变成习惯,价值才会真正出来。
八、一个很现实的问题:它真能解决 AI 编程翻车吗?
能解决一部分,而且是非常关键的一部分。
但它不是魔法。
它不能保证:
- 模型永远不出错
- 需求永远不变
- 代码一定完美
- 团队用了以后立刻变成精英工程组织
它真正能提高的是三件事:
1)减少流程性失误
比如没写 spec、任务没拆小、没验证就交付。这些其实是最常见也最没必要的失误。
2)让 AI 输出更稳定
你会发现,很多时候不是模型不行,而是调用方式太随缘。流程稳定了,结果自然也更稳。
3)让团队经验更容易沉淀
以前工程经验往往只存在老员工脑子里,现在可以一部分转成 skill。这个方向特别值钱。
九、我对这套东西的真实判断
如果让我一句话评价:Addy Skills 不是“又一个 AI 编程提示词包”,它更像是把资深工程师的做事顺序,编译成了 agent 能执行的工作协议。
它值钱的地方,不在于里面每一条原则都多新,而在于它把这些正确但经常被跳过的步骤,结构化、模块化、可复用地固化下来了。
这事儿其实挺关键。
因为接下来 AI coding 的竞争,未必只是比模型谁更强,很可能会越来越变成:
- 谁的流程更稳
- 谁的上下文组织更好
- 谁更会把团队经验变成可复用能力
- 谁能让 agent 少犯低级错误
从这个角度看,Addy Skills 很值得研究,哪怕你最后不用它原封不动的形态,也很值得把它背后的方法论吃透。
十、给想实操的人一份最短落地路径
如果你不想看完又收藏吃灰,可以直接按这个最短路径上手:
路径 1:个人开发者
第一步:先去 GitHub 看 README 和 getting-started
第二步:只挑 3 个技能先用:
- spec-driven-development
- test-driven-development
- code-review-and-quality
第三步:在你当前最常做的工具里接进去,比如 Claude Code、Cursor 或 Gemini CLI
第四步:接下来一周,刻意要求自己每次做稍微复杂的功能时,先 spec,再 build,再 test,再 review
路径 2:小团队
第一步:别上来全员铺开,先找 1 到 2 个项目试点
第二步:先统一这几个动作:
- 需求先写清
- 任务必须拆小
- AI 产出必须验证
- 交付前必须 review
第三步:把你们团队自己常踩坑的规范,也模仿这种技能格式沉淀出来
换句话说,最值钱的不只是用 Addy 的 skills,而是学会怎么写你们自己的 skills。
十一、最后总结
Addy Osmani 这套 Agent Skills 之所以值得关注,不是因为它让 AI 更会写代码了,而是因为它试图解决一个更根本的问题:怎么让 AI 写代码这件事,逐渐摆脱随缘,走向工程化。
如果你现在已经明显感觉到:
- AI 很强,但输出不稳定
- 小任务很好用,大任务容易跑偏
- 写代码快了,返工也变多了
- 团队开始大规模用 AI,但质量参差不齐
那这套东西,真值得认真看看。
一句话收尾:
以后真正拉开差距的,可能不是谁先用上 AI,而是谁先把“怎么用 AI 干活”这件事流程化、标准化、可复用化。Addy Skills,干的就是这件事。
顺手说一句,真准备把这套流程吃进团队里,少不了找个稳定点的云环境来跑代码助手、知识库、自动化脚本这些杂活。像雨云这种便宜但不虚标的云服务器,就挺适合拿来搭自己的 AI 开发工作台、测试环境和轻量服务,折腾成本没那么肉疼:点我直达。