OpenAI开始做减法了:真正的大招不是Sora,而是“替你操作电脑”的 Super App
OpenAI开始做减法了:真正的大招不是Sora,而是“替你操作电脑”的Super App
OpenAI最近释放了一个非常明确的信号。
它不再试图同时把所有炫目的方向都做到极致,而是开始主动做减法。哪怕是最容易出圈、最容易制造全民讨论的视频生成,哪怕是话题度极高的Sora,也可以暂时让位。原因并不复杂,因为OpenAI现在押注的,不是某个单点爆款,而是一个更大的终局目标:做出真正承接AGI的统一入口。
这个入口,已经越来越像一个“替你使用电脑、理解你目标、代表你完成工作”的Super App。
如果说过去几年AI行业的主线还是模型能力不断变强,那么接下来真正的分水岭,已经变成另一件事:AI能不能开始接管数字工作流。
一、为什么OpenAI宁可收缩Sora,也要集中火力做Super App
站在外部视角,这个决定其实相当反直觉。
Sora属于那种天然适合传播、最能形成视觉冲击的产品。视频生成比推理模型更容易火,也更容易把OpenAI送上话题中心。按照大多数公司的惯性打法,通常都会继续加码这种“明星业务”。
但OpenAI没有这么做。
Greg Brockman在对谈里说得很直白,Sora和GPT Reasoning并不是一条技术树上的东西。Sora更偏向视频生成、世界模型、机器人研究,而GPT这条线则更接近知识工作、工具调用、上下文理解和复杂任务执行。
这背后最现实的约束不是“想不想做”,而是“算力根本不够”。
在资源有限的前提下,OpenAI必须回答一个问题:哪条路更接近AGI,也更接近真实生产力落地?
他们给出的答案已经很明确,不是“让AI更会生成视频”,而是“让AI更会替人完成工作”。
所以,Sora被边缘化,不代表视频不重要,而代表OpenAI已经开始残酷聚焦。
一句话概括就是:
Sora代表的是更容易被看见的未来,Super App代表的是更可能先落地的未来。
二、真正的变化,不是AI会写代码,而是AI会替你用电脑
很多人理解Codex,还停留在“一个更强的编程助手”阶段。
但Greg在采访里其实已经把这个边界彻底打穿了。Coding只是表象,底层变化是AI正在从“帮你生成内容”,变成“直接替你操作浏览器、软件、文档和工作流”。
这意味着未来你和电脑的关系会被改写。
过去我们使用电脑,是自己去点按钮、切窗口、找菜单、处理报错、复制粘贴、跨工具搬运信息。未来则越来越像是在给一个数字执行者下达目标。
你不是在亲自操作软件,而是在指挥一个会操作软件的系统。
比如:
- 帮我把邮箱里这周所有合作反馈汇总成一份简报
- 去后台把这些资料填完,再整理成表格
- 读取这个Excel,把关键异常挑出来并生成汇报提纲
- 帮我把视频自动分章节,再输出剪辑建议
- 连接Slack、邮箱和文档,把一周意见整理成复盘
这已经不是传统聊天机器人了,而是开始具备agent化的computer use能力。
换句话说,OpenAI想做的,不是一个更聪明的聊天框,而是一个新的数字操作层。
三、Super App的本质,是把ChatGPT、Codex、浏览器能力和记忆系统收成一个入口
这次对谈里,Super App的轮廓其实已经非常清楚。
它本质上是在把几种原本分散的能力收敛成一个统一系统:
- ChatGPT的对话能力
- Codex的任务执行能力
- 浏览器和软件操作能力
- 长期记忆能力
- 个性化上下文理解能力
这件事为什么重要?
因为过去的大模型应用虽然越来越强,但一直是碎片化的。聊天是聊天,写代码是写代码,自动化是自动化,浏览器代理是浏览器代理,记忆系统又是一套额外外挂。用户必须在多个界面和多个产品之间切换,系统本身也难以真正形成“个人代理”。
而OpenAI现在的目标,是把这些零散能力汇总成一个AI layer。
这个layer不再只是回答问题,而是开始真正理解你是谁、你平时怎么工作、你有哪些偏好、你想完成什么目标,然后在这些上下文上持续帮你推进事情。
这其实已经不是传统意义上的产品升级,而是在逼近“个人AI操作系统”的雏形。
四、软件行业接下来的重构,不是多一个SaaS,而是软件开始围着人转
Greg提到一个非常关键的判断:传统软件为了服务大众,天然不够贴身。
这句话非常值得反复咀嚼。
今天绝大多数SaaS、本地软件、企业系统,本质上都是面向“平均用户”设计的。也正因为如此,用户必须去学习它的界面结构、菜单逻辑、交互方式、权限体系和术语系统。
过去一直是人去适应软件。
但Agent时代,软件会开始反过来适应人。
这意味着未来真正有价值的,不只是做一个适合所有人的标准化工具,而是让每个人都拥有一个理解自己目标、能调用多个工具、能动态编排工作流的个人系统。
很多过去只有大公司和技术团队才拥有的“定制化能力”,会开始向普通人释放。
以前你要做一个适合自己团队的内容后台,可能需要:
- 找开发者开发
- 购买多个SaaS组合
- 处理权限、表单和接口配置
- 自己手工串联流程
未来你可能只需要一句话:
“帮我做一个适合内容团队协作的后台,把YouTube数据接进来,再按缩略图表现自动排序。”
这也是为什么OpenAI越来越强调“人人都能用”,而不只是继续深耕程序员工具市场。
五、Spud不是重点,重点是OpenAI正在构建一台持续进化引擎
文章里另一个被反复提到的关键词是新模型Spud。
但Greg其实已经明确表达了一个意思:Spud当然重要,但重点从来不是某一次模型发布,而是OpenAI正在构建一套持续加速的能力引擎。
它的逻辑大致是这样的:
- 先做预训练,产出更强的base model
- 再做强化学习,让模型把能力迁移到真实问题上
- 再通过后训练补齐行为、指令遵循和可用性
- 再进一步把模型接入工具、工作流和用户反馈系统
- 最后在真实世界使用中继续反哺下一轮能力增长
这意味着,未来模型竞争不再只是“谁在某个benchmark更高”,而是谁能更快把模型、工具、记忆、上下文、交互循环和产品落地整合成闭环系统。
模型只是发动机,真正拉开差距的是整套系统工程。
六、最先被重构的,不是抽象意义上的AGI,而是知识工作
很多人一提AGI,就容易把它想得很遥远、很抽象。
但这场对谈真正值得注意的,不是OpenAI怎么定义AGI,而是他们已经明显把重心转向了“知识工作如何被重做”。
最先爆发的,不会是科幻意义上的超级智能,而是大量原本依赖电脑、依赖上下文、依赖重复操作和跨工具协作的工作场景。
最典型的包括:
- 软件开发
- 内容生产
- 数据分析与表格处理
- 汇报材料生成
- 企业内部自动化
- 营销、运营、客服等流程型知识工作
这些工作的共同点很明显:
- 都依赖电脑
- 都需要上下文
- 都存在大量重复动作
- 都需要跨多个工具完成
- 都适合“人监督,AI执行”
这正是agent最容易切进去、也最容易产生生产力裂变的领域。
所以真正的临界点不是“AI会不会替代所有人”,而是越来越多白领工作,会从“亲自干活”转向“指挥AI干活”。
七、Agent时代,人不会消失,而是被迫升级成管理者
Greg在采访里有一句话非常重要:使用autonomous agents时,人不能推卸责任。
这一点,其实说透了未来工作的本质变化。
很多人对Agent有两个误解。
第一,以为AI足够强之后,人就可以彻底甩手不管。 第二,以为AI开始执行任务之后,人就失去价值了。
其实都不对。
未来人的角色并不会消失,而是会发生升级。你会越来越像一个管理者:
- 负责设定目标
- 负责定义边界
- 负责分配任务
- 负责检查结果
- 负责承担后果
你可以把执行交给AI,但你不能把责任交给AI。
这也是为什么未来真正稀缺的能力,未必是纯执行能力,而是判断力、表达能力、任务拆解能力和结果审查能力。
说得更直接一点:
Agent时代最重要的能力,不一定是“你会不会做”,而是“你会不会让AI替你做,并确保它做对”。
八、OpenAI真正想做的,已经不是模型公司,而是AI操作系统公司
看完整场对谈,我的最大感受只有一句:
OpenAI已经不再满足于做一家模型公司,它正在往“AI操作系统公司”走。
Sora被边缘化,不是因为视频生成没价值,而是因为在OpenAI看来,真正接近AGI的入口,不是一个会生成内容的模型,而是一个能理解你、记住你、调用工具、替你完成任务的统一系统。
接下来几个月,我们大概率会持续看到三件事:
- Codex从程序员工具,扩展成通用知识工作工具
- ChatGPT继续增强记忆、上下文和computer use能力
- OpenAI把分散的agent能力一步步收敛成真正的Super App
如果这条路线跑通,AI行业接下来的竞争焦点会彻底变化。
不再是谁的模型参数更大,不再是谁的榜单分数更高,而是谁能最先做出那个真正“替用户运行数字生活”的总入口。
而这,可能才是OpenAI这一轮真正的大赌注。
可用于发布的摘要
OpenAI开始主动做减法了。哪怕是最容易出圈的Sora,也可以暂时让位,因为它真正押注的,不是单点爆款,而是一个能理解你、记住你、替你操作电脑和工作流的Super App。未来AI的主战场,不再只是模型更强,而是谁先做出那个真正承接数字生活与知识工作的统一入口。
备选标题
- OpenAI开始做减法了,真正的大招不是Sora,而是“替你用电脑”的Super App
- Sora都能先放一边,OpenAI真正想做的是你的AI操作系统
- OpenAI押注Super App:AI行业下一场大战,不在模型,而在入口
- 从ChatGPT到Super App,OpenAI正在做一个“替你工作”的统一系统