2026-04-14 08:51

Harness Engineering：驾驭AI Agent的六大核心组件

Agent的5个落地卡点

Agent确实越来越强。但一个问题也越来越明显：你不一定能真正掌控你搭建的系统。

Harness要解决的就是Agent五个落地卡点：

公式很简单：Agent = Model + Harness

底层是纯推理的大模型。Harness是包裹模型运行的一切外围——运行时环境、工具系统、上下文管理、权限控制、状态持久化、反馈循环。

Harness把大模型的大脑变成了Agent的身体。

DeepMind的Agent团队做过一个很有名的实验：模型固定不动，只换Harness，性能就能产生巨大差异。Anthropic也分享了同一个模型只换壳，编程成功率42%变78%，Terminal Bench排名差28位。

怎么写好一条指令。CoT是有用的，"Let's think step by step" 可以让大模型更好的推理。但本质都在打磨单次输入。

你给模型什么，就是你从它身上拿到什么。RAG、知识库、上下文调教，都是这个阶段。

只做Context Engineering目光高度不够了。Agent能力这么强，不只让它回答问题，还要让它自动采集、自动审核、自动完成任务。核心两个字：可控。

接受输入，通过工具执行、反复循环，确保问题解决了再返回结果。

通过工具调用扩展大模型的行动范围。

Context压缩、长任务连贯性、Compaction。

Allow、Deny、Ask。人得控制权限。

传代码到GitHub之前的安全检查。

控制运行时，让Agent的工作不因中断而丢失。

过去30年，工程师都在做一件事：驾驭复杂性。用两个字概括，就是抽象。

这是30年来的本质区别。以前的对象、架构、微服务、数据，输入确定，输出确定。Agent不是。

Harness就是驾驭这个不确定性系统的缰绳。 只要Agent是概率系统，就需要有人设计缰绳。这件事是结构性的，不是一阵风。

原文来源：探索AGI（微信公众号）