2026-04-19 21:15

最新 AI 风向变了,真正的竞争已经不是谁更会答题

如果只看这几天几家头部公司的动作,你会发现 AI 的竞争重点已经明显变了。

过去大家最关心的是谁更会答题,谁 benchmark 更高,谁上下文更长。现在这些当然还重要,但已经不再是最核心的分水岭。最新一轮产品更新里,更值得注意的其实是另一件事:AI 正在同时往“执行”“创作”“本地化”三个方向加速落地。

换句话说,行业已经开始从“模型能力竞赛”进入“能力怎么真正进入工作流”的阶段。

先看执行层。

OpenAI 这周对 Codex 的更新,最关键的地方不是模型又升级了,而是它开始越来越像一个真正能持续工作的代理系统。Computer Use、浏览器、记忆、插件扩容、并行 Agent、SSH、文档预览,这些功能单独看都不新鲜,但组合在一起之后,意义就完全变了。

以前的 AI 编程助手,核心还是帮你写代码。 现在的 Codex,明显在试图接管更大一段工作链路。

它不只是生成实现,还开始进入桌面环境、浏览器环境、协作环境和长期任务环境。也就是说,AI 不再只在 IDE 里帮你补全,而是开始跨出代码编辑器,往真实工作流里走。

这件事的重要性被很多人低估了。

因为软件开发里最耗人的,往往不是“把代码写出来”那一下,而是来回切换上下文、检查页面、处理评论、跑终端、翻文档、追任务、补材料、盯流水线。只要 AI 能真正吃掉这部分碎片劳动,它就不再只是效率插件,而会开始接近“数字同事”的位置。

这也是为什么我越来越觉得,未来 AI 产品的分水岭,不是会不会写代码,而是能不能稳定地进入完整工作流。

再看创作层。

Anthropic 最新推出的 Claude Design,虽然对外包装成设计和原型生成产品,但背后的意义比“会做 PPT”“会做 one-pager”更大。它说明一个很清楚的趋势:AI 正在从内容生成,走向更高阶的视觉表达生成。

这跟以前那种“帮你写文案,再顺手配张图”不是一个层级。

设计、原型、演示文稿、单页文档,这些东西本质上都属于结构化创作。它们要求的不只是生成内容,而是同时处理信息组织、视觉层级、表达节奏和呈现形式。AI 一旦开始稳定进入这个环节,意味着它开始从“会写”进化到“会表达”。

这件事会直接改变很多知识工作的生产方式。

过去很多团队最大的摩擦不是没有想法,而是很难把想法快速变成一个能给别人看、能拿去讨论、能拿去决策的可视化载体。现在如果 AI 能把设计表达这层也接过去,很多从概念到评审的链路就会被大幅压缩。

所以 Claude Design 真正代表的,不只是 Anthropic 在扩产品线,而是 AI 正在吃掉长期以来依赖“半专业设计表达”的那块工作。

然后是本地化和终端侧能力。

最近 Hugging Face 对 Gemma 4 的一系列展示,也释放了很强的信号。多模态、长上下文、可量化、可在多种推理框架和设备上运行,甚至部分小模型还支持音频输入,这背后说明的是另一条同样重要的路线:最强 AI 不再等于只能跑在最贵的云上。

这条线的意义非常现实。

因为 AI 真正进入生产和个人设备,迟早要面对三个问题:成本、延迟、隐私。

只要一切都必须通过云端最强模型完成,很多场景永远起不来。设备端、边缘端、私有化、本地工作流、离线处理,这些需求不是补充需求,而是下一阶段 AI 大规模普及的基础条件。

Gemma 4 这类模型最值得关注的,不只是参数设计,而是它在努力证明:高质量、多模态、Agent 友好的能力,也可以往更轻、更开放、更接近终端的方向落。

这会带来一个非常关键的变化。

未来的 AI 生态不会只有几家云巨头提供统一能力,而更可能是云端模型负责最复杂推理,本地模型负责高频调用和隐私任务,二者共同组成新的工作系统。谁能把这套组合做顺,谁就更接近真正的下一代平台。

把这三条线放在一起看,最近 AI 行业的局势其实已经相当清楚了。

第一阶段,大家比谁更聪明。 第二阶段,大家比谁更能进工作流。 第三阶段,大家比谁更能同时覆盖云端执行、结构化创作和本地部署。

现在我们大概就站在第二阶段全面展开、第三阶段刚开始成型的交叉点上。

这也是为什么,最近很多真正重要的更新,看上去都不像“某个模型跑分破纪录”那么炸裂,却反而更值得认真看。因为它们解决的不是演示问题,而是落地问题。

Codex 的方向,是让 AI 真正进系统、进桌面、进流程。 Claude Design 的方向,是让 AI 真正进表达、进视觉、进交付。 Gemma 4 的方向,则是让这些能力开始离开昂贵云端,进入更多设备和更开放的生态。

这三者拼起来,你会看到一个越来越明确的未来轮廓:

AI 不会只停留在聊天框里,也不会只属于少数模型厂商的封闭平台。它会越来越像一层普遍存在的能力基础设施,既能在云上代理执行,也能在本地陪着你工作,既能写,也能做,也能直接把结果组织成可交付的东西。

所以如果今天还用“哪个模型更强”去理解 AI 行业,已经有点太窄了。

更准确的问题应该是:

谁正在把 AI 变成真正能嵌入现实工作的系统。

从最近这一轮更新来看,答案已经不像去年那么模糊了。

AI 的下一场竞争,不只是智力竞争,而是工作入口竞争。谁先成为默认的执行层、默认的表达层、默认的本地能力层,谁就更有机会定义下一代软件长什么样。

而这场仗,现在才刚刚打热。