2026-04-21 18:21

腾讯云把 AI Agent 沙箱重新做了一遍,CubeSandbox 想同时解决安全、速度和并发

如果你最近在看 AI Agent 基础设施,大概率会发现一个越来越拧巴的问题。大家都想让 Agent 真去跑代码、开浏览器、处理文件、连工具,但一旦真把执行权限放出去,安全、启动速度、资源成本这三件事就很难同时兼顾。Docker 快是快,可隔离总归差点意思;传统虚拟机够稳,可一重起来,Agent 的交互体验就容易塌。腾讯云这次开源的 CubeSandbox,说白了,就是冲着这个老大难来的。

它的定位很直接:做一个专门服务 AI Agent 的沙箱执行层,而且不是停留在“能跑”的程度,而是想把启动速度、强隔离和高并发同时拉起来。项目底层基于 KVM 和 RustVMM,README 里给出的口径相当激进,完整可服务的 sandbox 冷启动可以做到 60ms 以内,额外内存开销压到 5MB 以下,还兼容 E2B SDK。这套组合拳一摆出来,味儿就很明显了,它不是普通的容器包装层,而是在试图定义一套 Agent 时代更像样的执行底座。

CubeSandbox 到底解决了什么问题

AI Agent 这两年一个很明显的变化,是它不再满足于“嘴上会”,而是开始频繁进入真正的执行链路。比如让 Agent 跑 Python、启动浏览器、读写文件、安装依赖、调用 shell、执行自动化测试,甚至直接去做在线 code interpreter 和批量评测。问题也正是在这里冒出来的。

如果你继续拿传统 Docker 容器去承接多租户 Agent 执行,会碰到几个绕不开的麻烦:

第一,隔离不够硬。 容器终究是共享宿主机内核的,平时做应用部署没那么刺眼,但到了不受信任代码执行场景,风险模型立刻就变了。

第二,传统虚拟机又太重。 你当然可以用 VM 来兜安全,但一旦启动时间按秒算、资源占用上来,Agent 的交互体验、并发能力和单位成本都会被拖垮。

第三,现有 Agent 生态已经开始围绕 E2B 这类执行接口聚拢。 如果你想让平台平滑切进去,最现实的路径不是重新教育整个上层,而是尽量兼容既有 SDK 和调用方式。

CubeSandbox 的思路可以概括成一句话:用接近微虚拟机的安全级别,做出接近容器的响应速度,再顺手把生态接入门槛压低。 这个方向要是成了,对 AI IDE、Code Agent、在线解释器、多租户自动化平台,都会很有吸引力。

它为什么值得注意,不只是因为“快”

表面上看,大家最容易被 CubeSandbox 的启动时间吸引,但真往下看,会发现它真正有意思的地方,不只是一个“快”字。

先说最亮眼的几个点。

1. 它在试图替代“容器 + 补丁式加固”的老思路

很多团队现在做 Agent 执行环境,路线其实都差不多:容器起一层,再叠 seccomp、cgroup、namespace、网络策略、沙箱代理、资源限制,最后希望整体足够安全。这个思路不是不能用,但系统一复杂,边界就容易变脆。

CubeSandbox 选的是另一条路,直接把底座放在 KVM 和 MicroVM 这套更硬的隔离模型上,再通过资源池和快照克隆把性能拉回来。也就是说,它不是在拼命给容器打补丁,而是在换一套更适合不受信任执行的基本盘。

2. 它瞄准的是 AI Agent,而不是普通云原生工作负载

这个区别很关键。普通应用部署关心的是稳定跑服务,但 Agent 场景更在乎的是:

  • 启动是不是足够快
  • 能不能频繁创建和销毁
  • 用户代码是不是能被硬隔离
  • 单机密度能不能做高
  • 对浏览器、文件、网络、Shell 这些能力支撑是不是完整

CubeSandbox 在 README 里直接把这些点说透了,甚至给了 Code Interpreter、Browser Automation、File Operations、Network Policies、Pause/Resume、OpenClaw Integration、RL Training 这些 example。这个信号挺明确,它不是“也许可以给 Agent 用”,而是从第一天就按 Agent 的需求画像来设计的。

3. 它把“兼容 E2B”当成了战略动作

这点很聪明。现在不少 AI coding 产品和 Agent 框架,已经把 E2B 当成了一层事实标准。如果一个新沙箱想进入这个市场,最难的不是技术做出来,而是如何降低迁移成本。

CubeSandbox 选择兼容 E2B SDK,本质上是在说:你上层代码别大动,我只替换下面那层执行引擎。 这一下,落地阻力就小多了。对于准备自建执行环境、又不想彻底重写集成层的团队来说,这个价值非常实际。

它的架构,明显是奔着生产环境去的

从公开文档和 README 看,CubeSandbox 并不是一个单点 demo,而是已经把服务编排、节点调度、网络隔离、虚拟化运行时这些关键部件拆明白了。

核心组件大致可以这么理解:

  • CubeAPI:对外提供高并发 REST API,兼容 E2B 协议
  • CubeMaster:集群级调度与资源管理中枢
  • Cubelet:节点本地的 sandbox 生命周期管理器
  • CubeProxy:负责请求转发和协议兼容
  • CubeVS:基于 eBPF 的虚拟交换层,负责网络隔离和安全策略
  • CubeHypervisor / CubeShim:底层虚拟化与 container runtime 对接层

这套拆法有一个很明显的味道:它不是给单机场景随便糊一个“可运行版本”,而是已经在往平台级服务设计靠了。单机能跑只是起点,真正的目标显然是多节点、高密度、可编排、可扩展的沙箱基础设施。

它适合什么场景

如果只把 CubeSandbox 理解成“能跑 Python 的隔离环境”,其实有点低估它了。它更适合几类正在快速增长的场景。

AI Coding Agent 和 Code Interpreter

这是最直接的一类。让 Agent 在隔离环境里执行用户代码、安装依赖、读写项目文件、返回结果,本来就是这类产品的基本动作。CubeSandbox 的启动速度和 E2B 兼容性,天然对这个场景友好。

Browser Use 和自动化代理

现在越来越多 Agent 不只是跑代码,还要开浏览器、登录页面、操作网页、抓取结果。一个可快速创建、可控网络策略、隔离足够强的运行环境,会比“把浏览器直接开在宿主机上”靠谱太多。

多租户 Agent 平台

只要平台上跑的是不同用户、不同任务甚至不同来源的代码,隔离就不能只靠“尽量别出事”。CubeSandbox 这类方案的意义,就在于把“默认高风险”改造成“默认隔离”。

评测、训练和大规模并发执行

README 里专门提到 RL 和 SWE-Bench 相关 demo,这说明它不只是面向产品前台交互,也在考虑离线评测、高并发任务编排这类更重的执行型工作负载。对做 benchmark、自动回归、策略训练的团队来说,这条线也挺有想象力。

它有没有门槛,有,而且还不低

这项目我看下来,一个结论挺明确:方向对,味儿也正,但它绝对不是那种“拉个 Docker 镜像一分钟就全员能上手”的轻松路线。

首先,它依赖 KVM-enabled x86_64 Linux。README 给的建议环境包括 WSL 2、Linux 物理机和云裸金属。换句话说,想认真跑它,底层环境得配合,不是随便一个普通开发机都能无痛搞定。

其次,它虽然把启动速度讲得很漂亮,但真实生产里真正难啃的,往往不是 benchmark 图本身,而是另外几件事:

  • 模板构建和版本管理顺不顺
  • 镜像分发和缓存机制稳不稳
  • 高并发下资源池回收是否靠谱
  • 网络策略、观测链路和审计能力够不够完整
  • 故障恢复、脏环境清理、长尾延迟控制做得咋样

这些问题,才决定它最终是“一个很酷的开源项目”,还是“真能在生产环境里顶住”。

但它依然很值得关注

即便把这些现实门槛都摆出来,我还是觉得 CubeSandbox 很值得盯。原因不复杂,因为它踩中的不是伪需求,而是 AI Agent 基础设施现在最疼的痛点之一。

今天很多团队嘴上说自己在做 Agent 平台,实际上底层执行层还是很旧的思路:不是把 Docker 再包一层,就是把虚拟机调得勉强能忍。问题是,Agent 真进入生产后,执行环境已经不再是幕后配角,它直接决定产品的安全边界、交互体验和资源成本。

CubeSandbox 真正有价值的地方,不只是“腾讯云又开源了一个项目”,而是它把这个问题回答得相当明确:Agent 时代需要一种新的默认执行模型,既要硬隔离,也要快启动,还得让生态迁移成本别太高。

这一点,如果它后续社区活跃度、稳定性和生产案例都能跟上,那它很可能不只是一个开源项目,而会变成未来 Agent 执行层竞争里的重要选手。

最后一句

如果你现在正在做 AI IDE、Code Agent、在线解释器、浏览器自动化代理,或者任何需要“替用户执行东西”的 AI 产品,那 CubeSandbox 这项目我建议别只看个标题就划过去。它讨论的不是边角料,而是整个 Agent 基础设施里最核心、也最难糊弄的一层。

这层东西,谁先做扎实,谁后面就更有底气。真不是虚的。

顺手提一嘴
如果你也在折腾 AI Agent、代码执行环境、自动化工作流这些活,服务器和对象存储别整太贵的,很多测试环境真没必要一步到位上大套餐。雨云这类方案更适合拿来做开发验证、跑 demo、挂轻量服务,成本相对更好控一点:https://www.rainyun.com/NDcxMTIz_