2026-04-15 01:35

Hermes Skills系统深度解析：生产级AI Agent的技能库架构

当AI Agent从玩具走向生产工具，一个核心问题浮现：如何让Agent持续积累能力，而不是每次对话都从零开始？Hermes的Skills系统提供了一个完整的工程化答案。

本文深度解析这个生产级技能库架构，涵盖创建、加载、安全、改进全生命周期。

Skill创建：从对话到可复用资产

Hermes让Agent可以通过对话直接创建Skill：

User: 帮我创建一个部署Vercel项目的Skill
Agent: 好的，我需要了解一些信息...

创建过程中，Agent会自动：

这让 tacit knowledge（隐性知识）变成 explicit knowledge（显性知识），可被版本控制、分享、复用。

受Anthropic Claude Skills启发，Hermes采用Progressive Disclosure策略。

问题：如果把50个Skill的完整内容都塞进System Prompt，可能吃掉100K+ tokens——既昂贵又可能超出上下文窗口。

解决方案：

这样，100个Skill只增加约2000 tokens，而不是500K。

Skills系统最大的安全隐患是Skill本身成为攻击载体。Hermes实现了完整的安全扫描：

Prompt Injection检测：检测"ignore previous instructions"等攻击模式 路径穿越防护：验证文件路径不会逃逸出Skill目录 环境变量依赖检查：缺失VERCEL_TOKEN时交互式提示用户 信任分级策略：

关键架构决策：Skill内容作为User Message注入，而非修改System Prompt。

原因：Anthropic的Prompt Caching机制要求System Prompt在整个对话中保持不变，否则会失去缓存优势，成本增加数十倍。

权衡：牺牲一点点指令跟随的可靠性，换取数十倍的API成本节约。这是深思熟虑的工程决策。

System Prompt明确要求："If a skill you loaded was missing steps... update it before finishing."

改进触发条件：

_patch_skill()函数复用了文件编辑工具的Fuzzy Match引擎，处理LLM回忆时的格式差异（空格、缩进、换行）。

改进后的级联效应：

Memory回答"是什么"，Skill回答"怎么做"。这种分工让Agent既有上下文感知，又有执行能力。

Hermes的Skills系统与2023年NVIDIA的Voyager论文有深刻渊源。Voyager在Minecraft中提出了Skill Library概念，但它是学术原型。

Hermes完成了完整的工程化落地，解决真实世界的复杂性：

这些"论文里不会提到"的问题，才是生产级系统的真正挑战。