2026-04-15 02:49

OpenAI开始做减法了：真正的大招不是Sora，而是“替你操作电脑”的 Super App

OpenAI开始做减法了：真正的大招不是Sora，而是“替你操作电脑”的Super App

OpenAI最近释放了一个非常明确的信号。

它不再试图同时把所有炫目的方向都做到极致，而是开始主动做减法。哪怕是最容易出圈、最容易制造全民讨论的视频生成，哪怕是话题度极高的Sora，也可以暂时让位。原因并不复杂，因为OpenAI现在押注的，不是某个单点爆款，而是一个更大的终局目标：做出真正承接AGI的统一入口。

这个入口，已经越来越像一个“替你使用电脑、理解你目标、代表你完成工作”的Super App。

如果说过去几年AI行业的主线还是模型能力不断变强，那么接下来真正的分水岭，已经变成另一件事：AI能不能开始接管数字工作流。

一、为什么OpenAI宁可收缩Sora，也要集中火力做Super App

站在外部视角，这个决定其实相当反直觉。

Sora属于那种天然适合传播、最能形成视觉冲击的产品。视频生成比推理模型更容易火，也更容易把OpenAI送上话题中心。按照大多数公司的惯性打法，通常都会继续加码这种“明星业务”。

但OpenAI没有这么做。

Greg Brockman在对谈里说得很直白，Sora和GPT Reasoning并不是一条技术树上的东西。Sora更偏向视频生成、世界模型、机器人研究，而GPT这条线则更接近知识工作、工具调用、上下文理解和复杂任务执行。

这背后最现实的约束不是“想不想做”，而是“算力根本不够”。

在资源有限的前提下，OpenAI必须回答一个问题：哪条路更接近AGI，也更接近真实生产力落地？

他们给出的答案已经很明确，不是“让AI更会生成视频”，而是“让AI更会替人完成工作”。

所以，Sora被边缘化，不代表视频不重要，而代表OpenAI已经开始残酷聚焦。

一句话概括就是：

Sora代表的是更容易被看见的未来，Super App代表的是更可能先落地的未来。

二、真正的变化，不是AI会写代码，而是AI会替你用电脑

很多人理解Codex，还停留在“一个更强的编程助手”阶段。

但Greg在采访里其实已经把这个边界彻底打穿了。Coding只是表象，底层变化是AI正在从“帮你生成内容”，变成“直接替你操作浏览器、软件、文档和工作流”。

这意味着未来你和电脑的关系会被改写。

过去我们使用电脑，是自己去点按钮、切窗口、找菜单、处理报错、复制粘贴、跨工具搬运信息。未来则越来越像是在给一个数字执行者下达目标。

你不是在亲自操作软件，而是在指挥一个会操作软件的系统。

比如：

帮我把邮箱里这周所有合作反馈汇总成一份简报
去后台把这些资料填完，再整理成表格
读取这个Excel，把关键异常挑出来并生成汇报提纲
帮我把视频自动分章节，再输出剪辑建议
连接Slack、邮箱和文档，把一周意见整理成复盘

这已经不是传统聊天机器人了，而是开始具备agent化的computer use能力。

换句话说，OpenAI想做的，不是一个更聪明的聊天框，而是一个新的数字操作层。

三、Super App的本质，是把ChatGPT、Codex、浏览器能力和记忆系统收成一个入口

这次对谈里，Super App的轮廓其实已经非常清楚。

它本质上是在把几种原本分散的能力收敛成一个统一系统：

ChatGPT的对话能力
Codex的任务执行能力
浏览器和软件操作能力
长期记忆能力
个性化上下文理解能力

这件事为什么重要？

因为过去的大模型应用虽然越来越强，但一直是碎片化的。聊天是聊天，写代码是写代码，自动化是自动化，浏览器代理是浏览器代理，记忆系统又是一套额外外挂。用户必须在多个界面和多个产品之间切换，系统本身也难以真正形成“个人代理”。

而OpenAI现在的目标，是把这些零散能力汇总成一个AI layer。

这个layer不再只是回答问题，而是开始真正理解你是谁、你平时怎么工作、你有哪些偏好、你想完成什么目标，然后在这些上下文上持续帮你推进事情。

这其实已经不是传统意义上的产品升级，而是在逼近“个人AI操作系统”的雏形。

四、软件行业接下来的重构，不是多一个SaaS，而是软件开始围着人转

Greg提到一个非常关键的判断：传统软件为了服务大众，天然不够贴身。

这句话非常值得反复咀嚼。

今天绝大多数SaaS、本地软件、企业系统，本质上都是面向“平均用户”设计的。也正因为如此，用户必须去学习它的界面结构、菜单逻辑、交互方式、权限体系和术语系统。

过去一直是人去适应软件。

但Agent时代，软件会开始反过来适应人。

这意味着未来真正有价值的，不只是做一个适合所有人的标准化工具，而是让每个人都拥有一个理解自己目标、能调用多个工具、能动态编排工作流的个人系统。

很多过去只有大公司和技术团队才拥有的“定制化能力”，会开始向普通人释放。

以前你要做一个适合自己团队的内容后台，可能需要：

找开发者开发
购买多个SaaS组合
处理权限、表单和接口配置
自己手工串联流程

未来你可能只需要一句话：

“帮我做一个适合内容团队协作的后台，把YouTube数据接进来，再按缩略图表现自动排序。”

这也是为什么OpenAI越来越强调“人人都能用”，而不只是继续深耕程序员工具市场。

五、Spud不是重点，重点是OpenAI正在构建一台持续进化引擎

文章里另一个被反复提到的关键词是新模型Spud。

但Greg其实已经明确表达了一个意思：Spud当然重要，但重点从来不是某一次模型发布，而是OpenAI正在构建一套持续加速的能力引擎。

它的逻辑大致是这样的：

先做预训练，产出更强的base model
再做强化学习，让模型把能力迁移到真实问题上
再通过后训练补齐行为、指令遵循和可用性
再进一步把模型接入工具、工作流和用户反馈系统
最后在真实世界使用中继续反哺下一轮能力增长

这意味着，未来模型竞争不再只是“谁在某个benchmark更高”，而是谁能更快把模型、工具、记忆、上下文、交互循环和产品落地整合成闭环系统。

模型只是发动机，真正拉开差距的是整套系统工程。

六、最先被重构的，不是抽象意义上的AGI，而是知识工作

很多人一提AGI，就容易把它想得很遥远、很抽象。

但这场对谈真正值得注意的，不是OpenAI怎么定义AGI，而是他们已经明显把重心转向了“知识工作如何被重做”。

最先爆发的，不会是科幻意义上的超级智能，而是大量原本依赖电脑、依赖上下文、依赖重复操作和跨工具协作的工作场景。

最典型的包括：

软件开发
内容生产
数据分析与表格处理
汇报材料生成
企业内部自动化
营销、运营、客服等流程型知识工作

这些工作的共同点很明显：

都依赖电脑
都需要上下文
都存在大量重复动作
都需要跨多个工具完成
都适合“人监督，AI执行”

这正是agent最容易切进去、也最容易产生生产力裂变的领域。

所以真正的临界点不是“AI会不会替代所有人”，而是越来越多白领工作，会从“亲自干活”转向“指挥AI干活”。

七、Agent时代，人不会消失，而是被迫升级成管理者

Greg在采访里有一句话非常重要：使用autonomous agents时，人不能推卸责任。

这一点，其实说透了未来工作的本质变化。

很多人对Agent有两个误解。

第一，以为AI足够强之后，人就可以彻底甩手不管。第二，以为AI开始执行任务之后，人就失去价值了。

其实都不对。

未来人的角色并不会消失，而是会发生升级。你会越来越像一个管理者：

负责设定目标
负责定义边界
负责分配任务
负责检查结果
负责承担后果

你可以把执行交给AI，但你不能把责任交给AI。

这也是为什么未来真正稀缺的能力，未必是纯执行能力，而是判断力、表达能力、任务拆解能力和结果审查能力。

说得更直接一点：

Agent时代最重要的能力，不一定是“你会不会做”，而是“你会不会让AI替你做，并确保它做对”。

八、OpenAI真正想做的，已经不是模型公司，而是AI操作系统公司

看完整场对谈，我的最大感受只有一句：

OpenAI已经不再满足于做一家模型公司，它正在往“AI操作系统公司”走。

Sora被边缘化，不是因为视频生成没价值，而是因为在OpenAI看来，真正接近AGI的入口，不是一个会生成内容的模型，而是一个能理解你、记住你、调用工具、替你完成任务的统一系统。

接下来几个月，我们大概率会持续看到三件事：

Codex从程序员工具，扩展成通用知识工作工具
ChatGPT继续增强记忆、上下文和computer use能力
OpenAI把分散的agent能力一步步收敛成真正的Super App

如果这条路线跑通，AI行业接下来的竞争焦点会彻底变化。

不再是谁的模型参数更大，不再是谁的榜单分数更高，而是谁能最先做出那个真正“替用户运行数字生活”的总入口。

而这，可能才是OpenAI这一轮真正的大赌注。

可用于发布的摘要

OpenAI开始主动做减法了。哪怕是最容易出圈的Sora，也可以暂时让位，因为它真正押注的，不是单点爆款，而是一个能理解你、记住你、替你操作电脑和工作流的Super App。未来AI的主战场，不再只是模型更强，而是谁先做出那个真正承接数字生活与知识工作的统一入口。

备选标题

OpenAI开始做减法了，真正的大招不是Sora，而是“替你用电脑”的Super App
Sora都能先放一边，OpenAI真正想做的是你的AI操作系统
OpenAI押注Super App：AI行业下一场大战，不在模型，而在入口
从ChatGPT到Super App，OpenAI正在做一个“替你工作”的统一系统