AI 吃 SaaS,真正涨价的是组织
## 01 触发事件
2025 年,《晚点》采访明略创始人吴明辉,给了几个非常具体的数字:他个人一周花约 5000 美元在 Agent 上;曾两周花 1 万美元 token 费;明略内部一个不到 10 人的 “Octo 章鱼” 核心团队,单日 token 消耗一度达到 3.7 万美元;个别工程师一天能打掉 8000 美元 token;这个小团队两个月写出近百万行代码。
更关键的是他给出的判断:软件“壳”的价值接近于零,闭源必死,未来收费方式会从人天、人月,转向 token 成本加管理费。
这不是一句创业者口号。
这是一个做了 20 年企业软件、经历过 2020-2022 年 AI 误判与组织收缩的人,在重新定义 enterprise software 的 cost structure 和 value capture。
我没在明略内部跑过 Octo,也没法验证“近百万行代码”里有多少是可维护生产代码,但这些数字已经足够说明问题:token 不再是实验预算,而开始变成部门级、产品级、甚至 P&L 级的经营科目。
软件本身的价值已经接近于没有了。一个亿的 token,就能大体复刻别人历史上几十亿堆出来的东西。以前大家按人月、人天收费。将来会变成 token 成本加管理费。
## 02 这事的真正含义
表面上看,这是“AI 正在杀死 SaaS”。
但真正发生的事,不是 SaaS 消失,而是 SaaS 的价值栈被拆开了。
过去 enterprise software 的定价逻辑,大致是:把复杂流程固化进 UI、权限、报表、数据库 schema,再通过 implementation 和 switching cost 把客户锁住。你卖的是一个完成品,哪怕很笨重,但可控、可审计、可部署。
现在 Agent 把这个逻辑拆成了三层。
第一层是 model access,也就是 token 本身。
第二层是 workflow orchestration,包括多 Agent 路由、权限、上下文注入、工具调用、审计。
第三层才是原本 SaaS 最显眼的“壳”:界面、表单、工作台、报表。
吴明辉说“软件壳价值接近于零”,指向的不是软件完全没价值,而是第三层在被快速 commoditize。真正会被定价的,开始变成第二层:谁能把人、Agent、上下文、权限和目标函数编排起来。
这才是他在说的事。
如果这套判断成立,那么企业软件公司未来的 moat 也会迁移。
不再主要是 feature depth,而是四个东西:
1. 真实工作流里的 distribution
2. 长期积累的组织上下文和权限图谱
3. 对 token 成本、质量、延迟的 routing 能力
4. 把结果接到业务责任链上的管理能力
“token 成本加管理费”这句话很像咨询业,也很像 cloud。
Cloud 把服务器采购 CAPEX 变成按量付费 OPEX;Agent 则在把一部分知识工作的人力 OPEX,改写成 token OPEX 加 orchestration fee。
我可能低估了一点:某些垂直 SaaS 的数据模型和 compliance 壁垒,未必会像他说得那样快归零。尤其在金融、医疗、政企里,“壳”背后其实是制度化流程,不只是前端界面。
但方向是清楚的:以前软件抽成的是工作流数字化溢价;以后平台抽成的是“让模型替你干活且别出事”的管理溢价。
## 03 历史类比 / 结构对照
这件事更像 2014 年前后的 AWS,而不是 2022 年的 ChatGPT。
ChatGPT 是需求侧冲击:所有人突然意识到自然语言接口可用。
而明略这类信号,是供给侧和组织侧冲击:企业开始把 token 当原材料,把 Agent 当劳动力,把内部协作系统当生产线。
AWS 当年最重要的变化,不是“服务器更便宜”这么简单。
而是创业公司第一次可以不买机器,直接按需调用计算,把 infra 变成 API。结果是 software company 的 formation cost 断崖式下降,创业速度提高,软件供给暴增。
今天 Agent 对 SaaS 做的事情很像这个过程。
不是简单替代某几个岗位,而是把“构建一个能工作的企业软件流程”的 formation cost 打下来。以前你要一个 PM、几个前后端、测试、实施、培训、运维,才能把客户需求固化成一个产品模块。现在很多环节可以被压缩到 token 和少数高杠杆的人。
所以我更愿意把它叫做 enterprise software 的 API 化时刻。
还有一个更贴切的类比是 iPhone 对运营商。
过去运营商掌控 distribution,手机厂商围着渠道转;iPhone 出现后,真正有价值的是操作系统、开发者生态和用户入口,运营商被降维成“流量管道”。
同样地,传统 SaaS 如果继续把自己理解成“业务流程 UI 提供商”,很可能会被降维成数据与权限管道。
上层的价值,会被 Agent runtime、工作流操作系统、模型路由层拿走。
我没法确认 Octo 最终会不会真成为这种 runtime 层产品,因为内部工具外部化通常比想象中难。Slack、Notion、Linear 这类产品之所以能扩张,不只是内部自用,而是自用经验可复制。企业协作系统则常常高度依赖公司文化与 org design。
但从历史模式看,当底层成本曲线突变时,最先崩掉的通常不是需求,而是原有抽成方式。
## 04 对 AI builder 意味着什么
如果我是 AI builder,看到这篇采访,短期会调整四件事。
第一,重新算 unit economics。
不要再把模型费当“研发试验成本”。如果你已经进入真实交付,token 就是 COGS。该做 prompt caching、batch、routing、fallback、context 截断、工具调用限流的,现在就做。
吴明辉团队不到 10 人单日 3.7 万美元 token 费,说明高强度 Agent 开发会迅速把“人贵还是模型贵”这个问题倒过来。
第二,别再迷恋完整 SaaS 壳子,优先做 workflow control point。
也就是:审批、权限、记录、可回放、上下文管理、工具接入、团队协作。
原因很简单,模型能力会继续波动,前端样式会被抄,真正不容易替代的是谁嵌进了企业日常动作链条。换句话说,switching cost 不再主要来自数据迁移,而来自组织迁移。
第三,产品包装要从 seat 逻辑转向 output 逻辑。
如果客户已经感知到“一个工程师一天 8000 美元 token 但依然值”,那说明市场接受的不是 seat 数,而是产出杠杆。
你未必要真的按 token 计费,但你的销售叙事、报价模型、毛利管理,都要能解释 token pass-through 和 orchestration premium。
第四,重估开源的位置。
吴明辉说“闭源必死”,这句话有情绪成分,但对应用层是有现实指向的:单靠闭源 UI 或私有 workflow,很难抵御底层模型和开源 Agent 框架的挤压。
更合理的策略可能不是全开或全闭,而是把可替代的壳开源,把真正的 moat 放在 hosted service、数据连接、审计、部署、SLA、组织网络效应上。
对 model API 消费者来说,这也是提醒:高价值客户未来要的不是“最强模型”,而是“最稳、最省、最可控的一组模型与路由组合”。这对网关平台反而是利好。模型越来越像电力,真正需要被管理的是负载、切换、峰谷和故障。
这点我也可能误判。
如果 frontier labs 很快把长上下文、工具调用、Agent memory、企业连接器全部 productize,很多中间层会被直接吞掉。那 builder 能抓住的窗口会更窄,更像 reseller 而不是 platform。
## 05 反方观点 / 风险
最值得反对我自己判断的地方,在于这篇采访本质上是一个高度兴奋、且有强烈转型诉求的创始人叙事。
兴奋本身不是证据。
第一,token 花得多,不等于经济价值真的创造出来了。
“一万美金创造十亿价值”更像创始人的主观估算,不是可审计的 ROI。AI 团队现在最容易犯的错,就是把速度感误认为产出,把并行生成误认为组织能力,把代码行数误认为产品完成度。
第二,多 Agent 协作未必天然优于单 Agent。
吴明辉把 MoA 类比 MoE,很有启发,但也可能过度类比。MoE 的 expert 是可训练、可测量、可优化的;多 Agent 网络则常常有 coordination overhead、幻觉传染、责任不清、evaluation 困难。
我没在他的系统里看到长期稳定性数据,所以“集体智慧涌现”现在更像 promising pattern,不是定论。
第三,“软件壳价值趋零”对很多行业可能太激进。
在广告、零售、分析这类信息密集型场景,Agent 更容易切进去。
但在 ERP、财务、医疗、供应链、工业软件里,软件壳从来不只是界面,而是流程约束、合规映射、异常处理、责任归属。那些东西不太可能被 token 迅速压平。
第四,“闭源必死”大概率是错的。
更准确地说,闭源的 generic app 会更危险,但拥有独家数据、强 distribution、深服务体系、合规优势的闭源系统,仍然可以活得很好。
真正会死的不是闭源,而是没有独占输入、又没有组织嵌入的中间层。
最后,还有一个更现实的问题:人类组织是否真的能承受这种节奏。
如果 token 成本超过人力成本,管理难题就不再是“该不该上 AI”,而是“谁有权限烧多少 token、为哪个目标负责、错误如何追责”。
也就是说,AI 可能先杀死的不是 SaaS,而是旧的预算制度和中层管理方法。
这也是我读完整篇采访后最在意的一点。
问题不在 AI 把软件变便宜。
问题在于,一旦软件和执行突然便宜到几乎无限供给,那个真正稀缺、真正会被重新定价的东西,就是组织判断力。
相关推荐
基于 #agent 推荐
ai-videoagent
AI视频Agent赚的不是壁垒
36kr这篇稿子真正有价值的不是“AI视频很热”,而是它给出了一个更残酷的结论:这批产品当前赚的是 model access 折扣、交付效率和流量投放套利,而不是 moat。一旦模型厂下场,真正被重估的是 distribution、workflow ownership 与 switching cos
5月7日·36kr.com
replitagent
Replit 的 AI 应用真账本
Replit 创始人在播客里抛出一个少见的硬信号:Agent 首日做到 100 万美元、公司一年从 250 万到 2.5 亿。问题不在励志故事,而在 AI coding 正从工具收费切到 outcome 收费,应用层第一次出现足够大的 token 吞吐与 retention 证明。
5月7日·pdst.fm
microsoftopenai
微软最怕的不是亏钱
微软早年内部最担心的不是投 OpenAI 回报率,而是 OpenAI 转投 Amazon 并反向定义 Azure 不适合 AI。真正被争夺的不是股权,而是默认算力分发权。
5月8日·www.theverge.com
appleairpods
Apple 把 AI 塞进耳机,不是玩具
Apple 正把带 camera 的 AirPods 推近量产测试,这不是配件升级,而是在试一种低摩擦 AI 入口:不经屏幕、持续感知、靠 Siri 查询环境。真正会被重估的是 AI distribution,不是耳机 ASP。
5月7日·www.theverge.com
TomofunFurbo
Furbo 宠物摄像头换掉 GPU 改用 AWS 自研芯片 — AI 推理降本跑出真实商业案例
台湾宠物科技公司 Tomofun 将 Furbo 摄像头的 AI 推理从 GPU 迁移到 AWS 自研芯片 Inferentia2,成本显著下降且精度不损。这标志着「推理专用芯片替代 GPU」不再只是厂商叙事,有了面向消费者的真实验证。
5月7日·aws.amazon.com
FFmpegVLC
VLC拒绝千万广告费 — 互联网视频基石FFmpeg面临维护者倦怠
全球互联网视频几乎都运行在FFmpeg这个开源工具库上,而核心维护者本周坦言倦怠是真实威胁。少数人无偿支撑基础设施的模式正接近极限。
5月7日·lexfridman.com