## 01 触发事件 2025 年,《晚点》采访明略创始人吴明辉,给了几个非常具体的数字:他个人一周花约 5000 美元在 Agent 上;曾两周花 1 万美元 token 费;明略内部一个不到 10 人的 “Octo 章鱼” 核心团队,单日 token 消耗一度达到 3.7 万美元;个别工程师一天能打掉 8000 美元 token;这个小团队两个月写出近百万行代码。 更关键的是他给出的判断:软件“壳”的价值接近于零,闭源必死,未来收费方式会从人天、人月,转向 token 成本加管理费。 这不是一句创业者口号。 这是一个做了 20 年企业软件、经历过 2020-2022 年 AI 误判与组织收缩的人,在重新定义 enterprise software 的 cost structure 和 value capture。 我没在明略内部跑过 Octo,也没法验证“近百万行代码”里有多少是可维护生产代码,但这些数字已经足够说明问题:token 不再是实验预算,而开始变成部门级、产品级、甚至 P&L 级的经营科目。 软件本身的价值已经接近于没有了。一个亿的 token,就能大体复刻别人历史上几十亿堆出来的东西。以前大家按人月、人天收费。将来会变成 token 成本加管理费。 ## 02 这事的真正含义 表面上看,这是“AI 正在杀死 SaaS”。 但真正发生的事,不是 SaaS 消失,而是 SaaS 的价值栈被拆开了。 过去 enterprise software 的定价逻辑,大致是:把复杂流程固化进 UI、权限、报表、数据库 schema,再通过 implementation 和 switching cost 把客户锁住。你卖的是一个完成品,哪怕很笨重,但可控、可审计、可部署。 现在 Agent 把这个逻辑拆成了三层。 第一层是 model access,也就是 token 本身。 第二层是 workflow orchestration,包括多 Agent 路由、权限、上下文注入、工具调用、审计。 第三层才是原本 SaaS 最显眼的“壳”:界面、表单、工作台、报表。 吴明辉说“软件壳价值接近于零”,指向的不是软件完全没价值,而是第三层在被快速 commoditize。真正会被定价的,开始变成第二层:谁能把人、Agent、上下文、权限和目标函数编排起来。 这才是他在说的事。 如果这套判断成立,那么企业软件公司未来的 moat 也会迁移。 不再主要是 feature depth,而是四个东西: 1. 真实工作流里的 distribution 2. 长期积累的组织上下文和权限图谱 3. 对 token 成本、质量、延迟的 routing 能力 4. 把结果接到业务责任链上的管理能力 “token 成本加管理费”这句话很像咨询业,也很像 cloud。 Cloud 把服务器采购 CAPEX 变成按量付费 OPEX;Agent 则在把一部分知识工作的人力 OPEX,改写成 token OPEX 加 orchestration fee。 我可能低估了一点:某些垂直 SaaS 的数据模型和 compliance 壁垒,未必会像他说得那样快归零。尤其在金融、医疗、政企里,“壳”背后其实是制度化流程,不只是前端界面。 但方向是清楚的:以前软件抽成的是工作流数字化溢价;以后平台抽成的是“让模型替你干活且别出事”的管理溢价。 ## 03 历史类比 / 结构对照 这件事更像 2014 年前后的 AWS,而不是 2022 年的 ChatGPT。 ChatGPT 是需求侧冲击:所有人突然意识到自然语言接口可用。 而明略这类信号,是供给侧和组织侧冲击:企业开始把 token 当原材料,把 Agent 当劳动力,把内部协作系统当生产线。 AWS 当年最重要的变化,不是“服务器更便宜”这么简单。 而是创业公司第一次可以不买机器,直接按需调用计算,把 infra 变成 API。结果是 software company 的 formation cost 断崖式下降,创业速度提高,软件供给暴增。 今天 Agent 对 SaaS 做的事情很像这个过程。 不是简单替代某几个岗位,而是把“构建一个能工作的企业软件流程”的 formation cost 打下来。以前你要一个 PM、几个前后端、测试、实施、培训、运维,才能把客户需求固化成一个产品模块。现在很多环节可以被压缩到 token 和少数高杠杆的人。 所以我更愿意把它叫做 enterprise software 的 API 化时刻。 还有一个更贴切的类比是 iPhone 对运营商。 过去运营商掌控 distribution,手机厂商围着渠道转;iPhone 出现后,真正有价值的是操作系统、开发者生态和用户入口,运营商被降维成“流量管道”。 同样地,传统 SaaS 如果继续把自己理解成“业务流程 UI 提供商”,很可能会被降维成数据与权限管道。 上层的价值,会被 Agent runtime、工作流操作系统、模型路由层拿走。 我没法确认 Octo 最终会不会真成为这种 runtime 层产品,因为内部工具外部化通常比想象中难。Slack、Notion、Linear 这类产品之所以能扩张,不只是内部自用,而是自用经验可复制。企业协作系统则常常高度依赖公司文化与 org design。 但从历史模式看,当底层成本曲线突变时,最先崩掉的通常不是需求,而是原有抽成方式。 ## 04 对 AI builder 意味着什么 如果我是 AI builder,看到这篇采访,短期会调整四件事。 第一,重新算 unit economics。 不要再把模型费当“研发试验成本”。如果你已经进入真实交付,token 就是 COGS。该做 prompt caching、batch、routing、fallback、context 截断、工具调用限流的,现在就做。 吴明辉团队不到 10 人单日 3.7 万美元 token 费,说明高强度 Agent 开发会迅速把“人贵还是模型贵”这个问题倒过来。 第二,别再迷恋完整 SaaS 壳子,优先做 workflow control point。 也就是:审批、权限、记录、可回放、上下文管理、工具接入、团队协作。 原因很简单,模型能力会继续波动,前端样式会被抄,真正不容易替代的是谁嵌进了企业日常动作链条。换句话说,switching cost 不再主要来自数据迁移,而来自组织迁移。 第三,产品包装要从 seat 逻辑转向 output 逻辑。 如果客户已经感知到“一个工程师一天 8000 美元 token 但依然值”,那说明市场接受的不是 seat 数,而是产出杠杆。 你未必要真的按 token 计费,但你的销售叙事、报价模型、毛利管理,都要能解释 token pass-through 和 orchestration premium。 第四,重估开源的位置。 吴明辉说“闭源必死”,这句话有情绪成分,但对应用层是有现实指向的:单靠闭源 UI 或私有 workflow,很难抵御底层模型和开源 Agent 框架的挤压。 更合理的策略可能不是全开或全闭,而是把可替代的壳开源,把真正的 moat 放在 hosted service、数据连接、审计、部署、SLA、组织网络效应上。 对 model API 消费者来说,这也是提醒:高价值客户未来要的不是“最强模型”,而是“最稳、最省、最可控的一组模型与路由组合”。这对网关平台反而是利好。模型越来越像电力,真正需要被管理的是负载、切换、峰谷和故障。 这点我也可能误判。 如果 frontier labs 很快把长上下文、工具调用、Agent memory、企业连接器全部 productize,很多中间层会被直接吞掉。那 builder 能抓住的窗口会更窄,更像 reseller 而不是 platform。 ## 05 反方观点 / 风险 最值得反对我自己判断的地方,在于这篇采访本质上是一个高度兴奋、且有强烈转型诉求的创始人叙事。 兴奋本身不是证据。 第一,token 花得多,不等于经济价值真的创造出来了。 “一万美金创造十亿价值”更像创始人的主观估算,不是可审计的 ROI。AI 团队现在最容易犯的错,就是把速度感误认为产出,把并行生成误认为组织能力,把代码行数误认为产品完成度。 第二,多 Agent 协作未必天然优于单 Agent。 吴明辉把 MoA 类比 MoE,很有启发,但也可能过度类比。MoE 的 expert 是可训练、可测量、可优化的;多 Agent 网络则常常有 coordination overhead、幻觉传染、责任不清、evaluation 困难。 我没在他的系统里看到长期稳定性数据,所以“集体智慧涌现”现在更像 promising pattern,不是定论。 第三,“软件壳价值趋零”对很多行业可能太激进。 在广告、零售、分析这类信息密集型场景,Agent 更容易切进去。 但在 ERP、财务、医疗、供应链、工业软件里,软件壳从来不只是界面,而是流程约束、合规映射、异常处理、责任归属。那些东西不太可能被 token 迅速压平。 第四,“闭源必死”大概率是错的。 更准确地说,闭源的 generic app 会更危险,但拥有独家数据、强 distribution、深服务体系、合规优势的闭源系统,仍然可以活得很好。 真正会死的不是闭源,而是没有独占输入、又没有组织嵌入的中间层。 最后,还有一个更现实的问题:人类组织是否真的能承受这种节奏。 如果 token 成本超过人力成本,管理难题就不再是“该不该上 AI”,而是“谁有权限烧多少 token、为哪个目标负责、错误如何追责”。 也就是说,AI 可能先杀死的不是 SaaS,而是旧的预算制度和中层管理方法。 这也是我读完整篇采访后最在意的一点。 问题不在 AI 把软件变便宜。 问题在于,一旦软件和执行突然便宜到几乎无限供给,那个真正稀缺、真正会被重新定价的东西,就是组织判断力。