AI Agents

Hermes MoA:把多个模型组织成一条可复核的 Agent 判断链

Hermes 的 MoA 新上线之后,最容易被误读成“多花点 token 换更强回答”。这太浅了。真正值得看的,是它把多个模型组织成一条可复核的判断链:参考模型先出不同视角,聚合模型再做取舍,最后仍然回到 Hermes 原本的工具循环里去执行。

这意味着 MoA 不是一个聊天花活,而是一个专门给高不确定性任务准备的决策层。它适合复杂架构、代码评审、故障排查、内容判断,以及任何“答错一次就很贵”的场景。

MoA 到底在补什么

单模型 agent 最大的问题,不是不会想,而是太容易在第一条路径上迅速自洽。模型一旦选错框架,后面的计划、解释、代码和建议都会朝同一个方向补齐。结果看起来很完整,实际上是把盲区包装成确定性。

MoA 的思路是先让多个 reference models 各自看一遍,再由 aggregator 汇总。这不是简单投票,而是先制造分歧,再让一个更强的模型做裁决。对于 Agent 来说,这比单模型更接近真实团队的工作方式。

在 Hermes 里,它为什么更像工作流而不是功能点

Hermes 本身有工具调用、技能、记忆、网关、会话和 cron。MoA 放进这个环境后,重点就不是“哪个模型更会说”,而是“哪个模型组合更适合当前任务”。一个模型看实现风险,一个模型看安全边界,一个模型看表达和总结,最后由 aggregator 给出最终动作。

这也解释了为什么 MoA 不是默认聊天模式。它会增加调用次数、延迟和成本,所以应该只在高价值任务上启用。要的是判断质量,不是每条消息都更长。

最值得用的场景

  • 架构选择:服务拆分、缓存、队列、数据库迁移。
  • 代码评审:正确性、安全性、测试缺口、维护成本。
  • 故障排查:缓存、配置、部署、权限、浏览器、CDN 等多因素问题。
  • 内容/SEO:选题、角度、原创性、搜索意图、发布风险。
  • 高风险自动化:批量改文件、上线、清理旧入口前的计划审查。

配置时该注意什么

  • reference models 负责并行看问题,aggregator 负责最终回复和工具调用。
  • MoA 预设应该按任务类型分,不要只有一个 default。
  • 它不是递归树,aggregator 不能再是另一个 MoA 预设。
  • 一个 reference 挂了不代表整轮失败,Hermes 会继续用可用结果。
  • MoA 不破坏 Hermes 的正常 prompt cache;它多消耗的是模型调用,不是缓存稳定性。

更现实的判断标准

MoA 是否值得开,不取决于它是不是“更高级”,而取决于你愿不愿意把模型当成一个需要复核的团队,而不是一个永远自信的单人选手。高风险任务里,多一个视角往往比多一点语气更值钱。