2026-04-24 09:05

Addy Skills 详细教程:把 AI 编程从“瞎写”拉回工程化流程

先说结论:Addy Osmani 这套 Agent Skills,真正厉害的地方不是又造了一套提示词,而是把资深工程师做项目时那套“先定义、再拆解、边做边验、上线前复核”的流程,打包成了 AI coding agent 能稳定执行的工作流。

很多人现在用 Claude Code、Codex、Gemini CLI、Cursor 写代码,最大的问题不是模型不够强,而是过程太飘:需求没讲清、上下文喂不全、一下子让模型改太多、做完也不验证。最后看起来写得挺快,实际上返工更多。

Addy Osmani 开源的 Agent Skills,正好就是冲着这件事来的:它不想让 AI 只会“接单吐代码”,而是逼着 agent 按工程化节奏做事。你可以把它理解成一套给 AI 编程助手上的“流程护栏”。这玩意儿最近能火,不是没道理。

一、Addy Skills 到底是啥?

它的 GitHub 仓库名叫 agent-skills,定位很直接:Production-grade engineering skills for AI coding agents。意思就是,这不是给人看的教程型文档,而是一套给 AI coding agent 用的工程技能包。

它把完整开发流程拆成了 6 个阶段:

  • Define:先把要做啥定义明白
  • Plan:把任务拆小
  • Build:增量实现
  • Verify:测试和调试
  • Review:质量审查
  • Ship:上线交付

对应到仓库里,就是一组 slash commands:

  • /spec
  • /plan
  • /build
  • /test
  • /review
  • /code-simplify
  • /ship

这套设计的核心思想很像一句大白话:别让 AI 直接开干,先让它像个靠谱工程师一样走流程。

二、它和普通 Prompt 最大的区别在哪?

很多人一听“skills”,第一反应是:哦,不就是高级提示词么?

还真不是。

普通 Prompt 更像一次性口头指令,比如“帮我写个登录页,React + Tailwind,顺便加测试”。看着挺完整,但 AI 还是容易偷懒,尤其在这些地方最容易翻车:

  • 跳过需求澄清
  • 直接写大块代码
  • 测试只写样子,不真跑
  • 改了一堆文件但没有验证边界
  • 输出像能跑,实际上项目一接就碎

Addy Skills 的思路是:把流程写死,把验证前置,把常见偷懒借口也提前堵住。

每个 skill 基本都不是“知识说明书”,而是一个完整工作单元,通常包含这些部分:

  • 什么时候用
  • 一步一步怎么做
  • 常见偷懒理由与反驳
  • 哪些迹象说明你已经跑偏了
  • 最后必须拿什么证据证明做完了

这点特别关键。因为 AI 最大的问题,往往不是不会,而是会在你没盯住的时候瞎省步骤。Addy 这套 skills,本质上就是给 agent 上了个“别糊弄”的制度。

三、为什么它最近一下子火了?

这波 Agent Skills 走红,背后其实踩中了 2025 到 2026 年 AI 编程最真实的痛点。

Addy 自己在《My LLM coding workflow going into 2026》里总结得很明确:AI coding assistant 已经足够强,但真正把它用好,并不是“说一句需求就自动完工”,而是要学会新的工作方式。

他说的几个核心点,和 Agent Skills 是完全对齐的:

1)先做 spec,再写代码

这是最关键的一步。

很多人直接一句“做个 xx 功能”,模型当然也会给你吐出一坨代码,但因为目标不清、边界没定、约束没说,后面一定返工。

Addy 的做法是:

  • 先和 AI 一起把问题问清楚
  • 再整理成 spec.md
  • 再生成 plan
  • 然后才进入实现

这也是为什么仓库里 /spec/plan 被放在最前面。它不是仪式感,而是为了压返工率。

2)任务必须拆小,不能一把梭

这是另一个特别实用的原则。

Agent 最怕大而全的任务。你一下子让它改十几个模块、补一堆逻辑、顺便重构,最后产出的代码经常像“十个程序员各写各的,谁也没对齐”。

所以 Addy Skills 非常强调:

  • 小步推进
  • 一次只做一个明确切片
  • 做完就验证
  • 再进入下一步

说白了,Agent 也得吃切片任务,不能硬塞满汉全席。

3)上下文工程比模型名字更重要

很多人纠结 Claude、GPT、Gemini 谁更强,但在真实项目里,往往更重要的是:你到底给了模型多少正确上下文。

Addy 在文章里提到一个很重要的方向叫 context packing

  • 把相关代码喂进去
  • 把约束喂进去
  • 把项目规则喂进去
  • 把官方文档喂进去
  • 把哪些方案不能用也提前说清楚

Agent Skills 里也有专门的 context-engineering。这说明它不是只关心“怎么写代码”,而是关心“怎么让 AI 在正确语境下写代码”。

四、仓库到底包含什么?

根据仓库 README,这套技能包目前围绕完整软件生命周期组织,核心是一组约 20 个 skills,外加 agent persona、参考清单和 setup 文档。

可以简单理解成四层:

第一层:流程入口命令

这层最适合新手直接上手:

你在干什么 对应命令 核心原则
定义要做什么 /spec 先规格,后代码
规划怎么做 /plan 拆成小任务
开始实现 /build 一次一个切片
验证结果 /test 测试是证据
上线前审查 /review 代码质量要过关
做代码简化 /code-simplify 清晰比炫技重要
准备发布 /ship 越快上线越要可控

第二层:核心技能模块

比如这些就特别有代表性:

  • spec-driven-development
  • planning-and-task-breakdown
  • incremental-implementation
  • test-driven-development
  • context-engineering
  • source-driven-development
  • api-and-interface-design
  • debugging-and-error-recovery
  • code-review-and-quality
  • security-and-hardening
  • shipping-and-launch

这套名字起得都很直白,基本一看就知道解决什么问题。

第三层:专用角色 Agent

仓库里还有 3 个预设角色:

  • code-reviewer
  • test-engineer
  • security-auditor

这个思路挺聪明:同一个 coding agent,在不同阶段切不同“审视视角”。

比如写完功能,不是继续让它以“实现者”心态自我欣赏,而是切换成 reviewer、QA、security auditor 去挑毛病。这个比一句泛泛的“你再检查一下”靠谱得多。

第四层:参考清单

仓库还给了测试、安全、性能、可访问性这些 checklist。

这意味着它不是只讲原则,而是尽量把“工程经验怎么被复用”也一起打包了。

五、怎么安装和接入?

这一块其实比想象中简单,因为它本质上就是 Markdown 技能文件,不依赖什么神秘闭源协议。

Claude Code

这是官方 README 里最推荐的方式。可以通过 marketplace 安装,也可以本地 clone 后作为 plugin-dir 使用。

适合人群:

  • 已经在用 Claude Code
  • 想把技能自动接进工作流
  • 希望 slash command 直接可用

Cursor

思路是把相关 SKILL.md 放进 .cursor/rules/,或者直接引用整个 skills/ 目录。

适合人群:

  • 已经在 Cursor 里长期写项目
  • 想把某些技能变成团队规则

Gemini CLI / Codex / 其他 Agent

通用 getting started 文档里写得很清楚:只要你的 agent 支持 Markdown 指令或规则文件,就能用。

也就是说,它不是绑死在某家工具链上的。

这个开放性其实很重要。因为现在 AI coding 工具更新太快了,今天火的是这个,明天可能又换。把 skill 写成通用 Markdown,本质上是在押注一种更长寿的资产:流程经验可以迁移,具体工具会不断变化。

六、最适合什么人用?

说实话,它不是给所有人准备的。

如果你现在还只是偶尔让 AI 帮你写个函数、补点样板代码,那你未必会立刻感受到这套 skills 的价值。

但下面几类人,我觉得会很吃这一套:

1)已经深度用 AI 写代码的人

你越频繁用 Claude Code、Codex、Gemini CLI、Cursor 这类工具,就越容易碰到“模型挺聪明,但老在流程上偷工减料”的问题。

这时候,Agent Skills 的价值就很明显:它不是提升天赋上限,而是提高稳定性下限。

2)带团队的人

如果团队里很多人开始用 AI 辅助开发,最怕的不是“不会用”,而是“每个人用法都不一样”。

有人直接让模型瞎写,有人认真写 spec,有人写完从不测。时间一长,团队输出质量会越来越分裂。

这时候,把 Agent Skills 当成团队共同工作协议,其实很合适。它相当于给 AI 协作补了一层流程标准化。

3)想从“vibe coding”往工程化走的人

很多人已经意识到,光靠 vibe coding 做 demo 很爽,但一旦上到真实项目,就会发现维护、复盘、交接、排错都很痛苦。

Addy 这套东西,本质上就是从“随缘写”往“工程化交付”挪一步。

七、上手建议:别一口气全装

这点我特别想强调。

getting-started 文档里其实已经提醒了:不要一上来把所有 skills 全塞进上下文。

为什么?因为上下文不是越多越好。塞太满,反而会让 agent 判断迟钝、重点模糊。

更合理的上手顺序,我建议这样:

第一阶段:先装 3 个基础技能

最值得优先上的,就是这 3 个:

  • spec-driven-development
  • test-driven-development
  • code-review-and-quality

原因很简单:

  • 一个负责别乱开工
  • 一个负责别瞎写完不测
  • 一个负责别自我感觉良好就交付

这三个已经能解决大多数 AI coding 场景里最常见的翻车点。

第二阶段:按场景加载专项技能

比如:

  • 做前端,就加 frontend-ui-engineering
  • 查 bug,就加 debugging-and-error-recovery
  • 接新框架,就加 source-driven-development
  • 改接口,就加 api-and-interface-design
  • 准备上线,就加 shipping-and-launch

这个思路非常像工具箱:不是把所有工具背在身上,而是干啥拿啥。

第三阶段:把技能融入你现有流程

真正高级的玩法,不是“我今天试了个新 skill”,而是把它融进日常:

  • 新需求默认先 /spec
  • 复杂功能默认先 /plan
  • 大一点的改动按 incremental-implementation 切片推进
  • 每次交付前走一次 review

当它变成习惯,价值才会真正出来。

八、一个很现实的问题:它真能解决 AI 编程翻车吗?

能解决一部分,而且是非常关键的一部分。

但它不是魔法。

它不能保证:

  • 模型永远不出错
  • 需求永远不变
  • 代码一定完美
  • 团队用了以后立刻变成精英工程组织

它真正能提高的是三件事:

1)减少流程性失误

比如没写 spec、任务没拆小、没验证就交付。这些其实是最常见也最没必要的失误。

2)让 AI 输出更稳定

你会发现,很多时候不是模型不行,而是调用方式太随缘。流程稳定了,结果自然也更稳。

3)让团队经验更容易沉淀

以前工程经验往往只存在老员工脑子里,现在可以一部分转成 skill。这个方向特别值钱。

九、我对这套东西的真实判断

如果让我一句话评价:Addy Skills 不是“又一个 AI 编程提示词包”,它更像是把资深工程师的做事顺序,编译成了 agent 能执行的工作协议。

它值钱的地方,不在于里面每一条原则都多新,而在于它把这些正确但经常被跳过的步骤,结构化、模块化、可复用地固化下来了。

这事儿其实挺关键。

因为接下来 AI coding 的竞争,未必只是比模型谁更强,很可能会越来越变成:

  • 谁的流程更稳
  • 谁的上下文组织更好
  • 谁更会把团队经验变成可复用能力
  • 谁能让 agent 少犯低级错误

从这个角度看,Addy Skills 很值得研究,哪怕你最后不用它原封不动的形态,也很值得把它背后的方法论吃透。

十、给想实操的人一份最短落地路径

如果你不想看完又收藏吃灰,可以直接按这个最短路径上手:

路径 1:个人开发者

第一步:先去 GitHub 看 README 和 getting-started

第二步:只挑 3 个技能先用:

  • spec-driven-development
  • test-driven-development
  • code-review-and-quality

第三步:在你当前最常做的工具里接进去,比如 Claude Code、Cursor 或 Gemini CLI

第四步:接下来一周,刻意要求自己每次做稍微复杂的功能时,先 spec,再 build,再 test,再 review

路径 2:小团队

第一步:别上来全员铺开,先找 1 到 2 个项目试点

第二步:先统一这几个动作:

  • 需求先写清
  • 任务必须拆小
  • AI 产出必须验证
  • 交付前必须 review

第三步:把你们团队自己常踩坑的规范,也模仿这种技能格式沉淀出来

换句话说,最值钱的不只是用 Addy 的 skills,而是学会怎么写你们自己的 skills。

十一、最后总结

Addy Osmani 这套 Agent Skills 之所以值得关注,不是因为它让 AI 更会写代码了,而是因为它试图解决一个更根本的问题:怎么让 AI 写代码这件事,逐渐摆脱随缘,走向工程化。

如果你现在已经明显感觉到:

  • AI 很强,但输出不稳定
  • 小任务很好用,大任务容易跑偏
  • 写代码快了,返工也变多了
  • 团队开始大规模用 AI,但质量参差不齐

那这套东西,真值得认真看看。

一句话收尾:

以后真正拉开差距的,可能不是谁先用上 AI,而是谁先把“怎么用 AI 干活”这件事流程化、标准化、可复用化。Addy Skills,干的就是这件事。


顺手说一句,真准备把这套流程吃进团队里,少不了找个稳定点的云环境来跑代码助手、知识库、自动化脚本这些杂活。像雨云这种便宜但不虚标的云服务器,就挺适合拿来搭自己的 AI 开发工作台、测试环境和轻量服务,折腾成本没那么肉疼:点我直达