2026-04-24 09:05

Addy Skills 详细教程：把 AI 编程从“瞎写”拉回工程化流程

先说结论：Addy Osmani 这套 Agent Skills，真正厉害的地方不是又造了一套提示词，而是把资深工程师做项目时那套“先定义、再拆解、边做边验、上线前复核”的流程，打包成了 AI coding agent 能稳定执行的工作流。

很多人现在用 Claude Code、Codex、Gemini CLI、Cursor 写代码，最大的问题不是模型不够强，而是过程太飘：需求没讲清、上下文喂不全、一下子让模型改太多、做完也不验证。最后看起来写得挺快，实际上返工更多。

Addy Osmani 开源的 Agent Skills，正好就是冲着这件事来的：它不想让 AI 只会“接单吐代码”，而是逼着 agent 按工程化节奏做事。你可以把它理解成一套给 AI 编程助手上的“流程护栏”。这玩意儿最近能火，不是没道理。

一、Addy Skills 到底是啥？

它的 GitHub 仓库名叫 agent-skills，定位很直接：Production-grade engineering skills for AI coding agents。意思就是，这不是给人看的教程型文档，而是一套给 AI coding agent 用的工程技能包。

它把完整开发流程拆成了 6 个阶段：

Define：先把要做啥定义明白
Plan：把任务拆小
Build：增量实现
Verify：测试和调试
Review：质量审查
Ship：上线交付

对应到仓库里，就是一组 slash commands：

/spec
/plan
/build
/test
/review
/code-simplify
/ship

这套设计的核心思想很像一句大白话：别让 AI 直接开干，先让它像个靠谱工程师一样走流程。

二、它和普通 Prompt 最大的区别在哪？

很多人一听“skills”，第一反应是：哦，不就是高级提示词么？

还真不是。

普通 Prompt 更像一次性口头指令，比如“帮我写个登录页，React + Tailwind，顺便加测试”。看着挺完整，但 AI 还是容易偷懒，尤其在这些地方最容易翻车：

跳过需求澄清
直接写大块代码
测试只写样子，不真跑
改了一堆文件但没有验证边界
输出像能跑，实际上项目一接就碎

Addy Skills 的思路是：把流程写死，把验证前置，把常见偷懒借口也提前堵住。

每个 skill 基本都不是“知识说明书”，而是一个完整工作单元，通常包含这些部分：

什么时候用
一步一步怎么做
常见偷懒理由与反驳
哪些迹象说明你已经跑偏了
最后必须拿什么证据证明做完了

这点特别关键。因为 AI 最大的问题，往往不是不会，而是会在你没盯住的时候瞎省步骤。Addy 这套 skills，本质上就是给 agent 上了个“别糊弄”的制度。

三、为什么它最近一下子火了？

这波 Agent Skills 走红，背后其实踩中了 2025 到 2026 年 AI 编程最真实的痛点。

Addy 自己在《My LLM coding workflow going into 2026》里总结得很明确：AI coding assistant 已经足够强，但真正把它用好，并不是“说一句需求就自动完工”，而是要学会新的工作方式。

他说的几个核心点，和 Agent Skills 是完全对齐的：

1）先做 spec，再写代码

这是最关键的一步。

很多人直接一句“做个 xx 功能”，模型当然也会给你吐出一坨代码，但因为目标不清、边界没定、约束没说，后面一定返工。

Addy 的做法是：

先和 AI 一起把问题问清楚
再整理成 spec.md
再生成 plan
然后才进入实现

这也是为什么仓库里 /spec 和 /plan 被放在最前面。它不是仪式感，而是为了压返工率。

2）任务必须拆小，不能一把梭

这是另一个特别实用的原则。

Agent 最怕大而全的任务。你一下子让它改十几个模块、补一堆逻辑、顺便重构，最后产出的代码经常像“十个程序员各写各的，谁也没对齐”。

所以 Addy Skills 非常强调：

小步推进
一次只做一个明确切片
做完就验证
再进入下一步

说白了，Agent 也得吃切片任务，不能硬塞满汉全席。

3）上下文工程比模型名字更重要

很多人纠结 Claude、GPT、Gemini 谁更强，但在真实项目里，往往更重要的是：你到底给了模型多少正确上下文。

Addy 在文章里提到一个很重要的方向叫 context packing：

把相关代码喂进去
把约束喂进去
把项目规则喂进去
把官方文档喂进去
把哪些方案不能用也提前说清楚

Agent Skills 里也有专门的 context-engineering。这说明它不是只关心“怎么写代码”，而是关心“怎么让 AI 在正确语境下写代码”。

四、仓库到底包含什么？

根据仓库 README，这套技能包目前围绕完整软件生命周期组织，核心是一组约 20 个 skills，外加 agent persona、参考清单和 setup 文档。

可以简单理解成四层：

第一层：流程入口命令

这层最适合新手直接上手：

你在干什么	对应命令	核心原则
定义要做什么	`/spec`	先规格，后代码
规划怎么做	`/plan`	拆成小任务
开始实现	`/build`	一次一个切片
验证结果	`/test`	测试是证据
上线前审查	`/review`	代码质量要过关
做代码简化	`/code-simplify`	清晰比炫技重要
准备发布	`/ship`	越快上线越要可控

第二层：核心技能模块

比如这些就特别有代表性：

spec-driven-development
planning-and-task-breakdown
incremental-implementation
test-driven-development
context-engineering
source-driven-development
api-and-interface-design
debugging-and-error-recovery
code-review-and-quality
security-and-hardening
shipping-and-launch

这套名字起得都很直白，基本一看就知道解决什么问题。

第三层：专用角色 Agent

仓库里还有 3 个预设角色：

code-reviewer
test-engineer
security-auditor

这个思路挺聪明：同一个 coding agent，在不同阶段切不同“审视视角”。

比如写完功能，不是继续让它以“实现者”心态自我欣赏，而是切换成 reviewer、QA、security auditor 去挑毛病。这个比一句泛泛的“你再检查一下”靠谱得多。

第四层：参考清单

仓库还给了测试、安全、性能、可访问性这些 checklist。

这意味着它不是只讲原则，而是尽量把“工程经验怎么被复用”也一起打包了。

五、怎么安装和接入？

这一块其实比想象中简单，因为它本质上就是 Markdown 技能文件，不依赖什么神秘闭源协议。

Claude Code

这是官方 README 里最推荐的方式。可以通过 marketplace 安装，也可以本地 clone 后作为 plugin-dir 使用。

适合人群：

已经在用 Claude Code
想把技能自动接进工作流
希望 slash command 直接可用

Cursor

思路是把相关 SKILL.md 放进 .cursor/rules/，或者直接引用整个 skills/ 目录。

适合人群：

已经在 Cursor 里长期写项目
想把某些技能变成团队规则

Gemini CLI / Codex / 其他 Agent

通用 getting started 文档里写得很清楚：只要你的 agent 支持 Markdown 指令或规则文件，就能用。

也就是说，它不是绑死在某家工具链上的。

这个开放性其实很重要。因为现在 AI coding 工具更新太快了，今天火的是这个，明天可能又换。把 skill 写成通用 Markdown，本质上是在押注一种更长寿的资产：流程经验可以迁移，具体工具会不断变化。

六、最适合什么人用？

说实话，它不是给所有人准备的。

如果你现在还只是偶尔让 AI 帮你写个函数、补点样板代码，那你未必会立刻感受到这套 skills 的价值。

但下面几类人，我觉得会很吃这一套：

1）已经深度用 AI 写代码的人

你越频繁用 Claude Code、Codex、Gemini CLI、Cursor 这类工具，就越容易碰到“模型挺聪明，但老在流程上偷工减料”的问题。

这时候，Agent Skills 的价值就很明显：它不是提升天赋上限，而是提高稳定性下限。

2）带团队的人

如果团队里很多人开始用 AI 辅助开发，最怕的不是“不会用”，而是“每个人用法都不一样”。

有人直接让模型瞎写，有人认真写 spec，有人写完从不测。时间一长，团队输出质量会越来越分裂。

这时候，把 Agent Skills 当成团队共同工作协议，其实很合适。它相当于给 AI 协作补了一层流程标准化。

3）想从“vibe coding”往工程化走的人

很多人已经意识到，光靠 vibe coding 做 demo 很爽，但一旦上到真实项目，就会发现维护、复盘、交接、排错都很痛苦。

Addy 这套东西，本质上就是从“随缘写”往“工程化交付”挪一步。

七、上手建议：别一口气全装

这点我特别想强调。

getting-started 文档里其实已经提醒了：不要一上来把所有 skills 全塞进上下文。

为什么？因为上下文不是越多越好。塞太满，反而会让 agent 判断迟钝、重点模糊。

更合理的上手顺序，我建议这样：

第一阶段：先装 3 个基础技能

最值得优先上的，就是这 3 个：

spec-driven-development
test-driven-development
code-review-and-quality

原因很简单：

一个负责别乱开工
一个负责别瞎写完不测
一个负责别自我感觉良好就交付

这三个已经能解决大多数 AI coding 场景里最常见的翻车点。

第二阶段：按场景加载专项技能

比如：

做前端，就加 frontend-ui-engineering
查 bug，就加 debugging-and-error-recovery
接新框架，就加 source-driven-development
改接口，就加 api-and-interface-design
准备上线，就加 shipping-and-launch

这个思路非常像工具箱：不是把所有工具背在身上，而是干啥拿啥。

第三阶段：把技能融入你现有流程

真正高级的玩法，不是“我今天试了个新 skill”，而是把它融进日常：

新需求默认先 /spec
复杂功能默认先 /plan
大一点的改动按 incremental-implementation 切片推进
每次交付前走一次 review

当它变成习惯，价值才会真正出来。

八、一个很现实的问题：它真能解决 AI 编程翻车吗？

能解决一部分，而且是非常关键的一部分。

但它不是魔法。

它不能保证：

模型永远不出错
需求永远不变
代码一定完美
团队用了以后立刻变成精英工程组织

它真正能提高的是三件事：

1）减少流程性失误

比如没写 spec、任务没拆小、没验证就交付。这些其实是最常见也最没必要的失误。

2）让 AI 输出更稳定

你会发现，很多时候不是模型不行，而是调用方式太随缘。流程稳定了，结果自然也更稳。

3）让团队经验更容易沉淀

以前工程经验往往只存在老员工脑子里，现在可以一部分转成 skill。这个方向特别值钱。

九、我对这套东西的真实判断

如果让我一句话评价：Addy Skills 不是“又一个 AI 编程提示词包”，它更像是把资深工程师的做事顺序，编译成了 agent 能执行的工作协议。

它值钱的地方，不在于里面每一条原则都多新，而在于它把这些正确但经常被跳过的步骤，结构化、模块化、可复用地固化下来了。

这事儿其实挺关键。

因为接下来 AI coding 的竞争，未必只是比模型谁更强，很可能会越来越变成：

谁的流程更稳
谁的上下文组织更好
谁更会把团队经验变成可复用能力
谁能让 agent 少犯低级错误

从这个角度看，Addy Skills 很值得研究，哪怕你最后不用它原封不动的形态，也很值得把它背后的方法论吃透。

十、给想实操的人一份最短落地路径

如果你不想看完又收藏吃灰，可以直接按这个最短路径上手：

路径 1：个人开发者

第一步：先去 GitHub 看 README 和 getting-started

第二步：只挑 3 个技能先用：

spec-driven-development
test-driven-development
code-review-and-quality

第三步：在你当前最常做的工具里接进去，比如 Claude Code、Cursor 或 Gemini CLI

第四步：接下来一周，刻意要求自己每次做稍微复杂的功能时，先 spec，再 build，再 test，再 review

路径 2：小团队

第一步：别上来全员铺开，先找 1 到 2 个项目试点

第二步：先统一这几个动作：

需求先写清
任务必须拆小
AI 产出必须验证
交付前必须 review

第三步：把你们团队自己常踩坑的规范，也模仿这种技能格式沉淀出来

换句话说，最值钱的不只是用 Addy 的 skills，而是学会怎么写你们自己的 skills。

十一、最后总结

Addy Osmani 这套 Agent Skills 之所以值得关注，不是因为它让 AI 更会写代码了，而是因为它试图解决一个更根本的问题：怎么让 AI 写代码这件事，逐渐摆脱随缘，走向工程化。

如果你现在已经明显感觉到：

AI 很强，但输出不稳定
小任务很好用，大任务容易跑偏
写代码快了，返工也变多了
团队开始大规模用 AI，但质量参差不齐

那这套东西，真值得认真看看。

一句话收尾：

以后真正拉开差距的，可能不是谁先用上 AI，而是谁先把“怎么用 AI 干活”这件事流程化、标准化、可复用化。Addy Skills，干的就是这件事。

顺手说一句，真准备把这套流程吃进团队里，少不了找个稳定点的云环境来跑代码助手、知识库、自动化脚本这些杂活。像雨云这种便宜但不虚标的云服务器，就挺适合拿来搭自己的 AI 开发工作台、测试环境和轻量服务，折腾成本没那么肉疼：点我直达。