01 触发事件

近日,36Kr 报道硅基流动完成超20亿元 B 轮融资,投资方包括携程战投、晶科能源控股、金蝶股份、壁仞战投、蔚来资本、商汤战投、巨人网络、国泰君安创新投等。更值得看的是经营数据:公司称过去一年通过 Token 工厂模式提供 MaaS,日均 Token 调用量达数万亿,服务超 1000 万用户和 1 万家企业客户营收同比增长超 10 倍海外市场单月营收达数百万美元

这不是一条“某 AI 公司又融了一笔钱”的新闻。

这是一条中国 AI API 分发层开始出现经营杠杆的信号。

我没在内部看过它的收入结构,也不知道这“数万亿 Token”里有多少是低价、缓存命中、批处理或者 internal subsidized traffic;但即便打折看,这组数字仍然说明一件事:至少在一部分市场里,模型接入、路由、交付、计费、稳定性和企业服务,已经可以被打包成独立价值,而不只是模型厂商旁边的一层薄代理。

日均Token调用量达数万亿,服务超1000万用户和1万家企业客户,营收同比增长超10倍,海外市场单月营收达数百万美元

问题不在“有没有需求”。

问题在于,谁能把需求组织成可结算、可预测、可扩张的 Token 流量

02 这事的真正含义

表面上看,硅基流动拿到的是融资。

真正含义是:Token gateway / MaaS 层正在从渠道角色,变成算力与模型供给侧之间的需求聚合器

这才是这件事在说的事。

过去一年,行业里有很多人默认一个判断:模型能力持续上升,最终会压缩中间层;开发者直接去 OpenAI、Anthropic、Google,或者直接接开源模型 self-host,平台型中间商会被吃掉。

这个判断现在不一定成立,至少没那么快成立。

原因很简单:当模型供给变多、价格频繁调整、context window 拉长、prompt caching 和 batch API 开始改写成本结构后,开发者面临的问题已经不再是“能不能调到模型”,而是:

  • 哪个模型在这个任务上性价比最高
  • 峰值流量时谁有容量
  • 海内外不同区域怎么做 routing
  • 企业客户要不要私有化 / 专线 / 合规隔离
  • 怎么把模型升级、fallback、计费和 SLA 封装成稳定产品

这时,中间层反而更有价值。

Ben Thompson 讲 aggregation theory 的核心,不是谁拥有内容,而是谁拥有需求侧关系。放到 AI API 市场,真正稀缺的不是“再多一个模型接入口”,而是已经被聚合起来的开发者流量和企业调用习惯。一旦你站在需求聚合端,向上就可以压模型价格,向下就可以打包 billing、observability、caching、failover、compliance,形成 switching cost。

我可能高估了这一层的 moat,因为很多能力理论上 cloud provider、模型原厂、甚至优秀开源项目都能补齐;但现实世界里,企业不会因为“理论上可替代”就立刻迁移。谁先把复杂性产品化,谁就先拿到分发权。

更关键的是,硅基流动披露了两个同时成立的信号:

第一,流量规模已经不是 demo 级别,而是“数万亿 Token/日”。

第二,海外月营收数百万美元说明这不是纯本土政策或关系驱动的生意,至少有一部分能力可以跨市场出售。

这意味着 token business 的竞争单元,正在从“单个模型胜负”转向“跨模型供给编排能力”。

那个真正会被定价的,不是模型参数,不是 benchmark 排名,而是把不稳定的模型供给,变成稳定可买的 API 商品

03 历史类比 / 结构对照

如果要找历史类比,我更愿意把它类比成 2014 年前后的 AWS,而不是 2022 年的 ChatGPT。

ChatGPT 是需求爆发点。

AWS 则是把底层复杂性抽象成标准化消费单位的商业拐点。

AI 行业现在当然还没走到 AWS 那么稳的阶段,我也可能把成熟度说得太高;但结构上已经很像:底层是稀缺算力和快速迭代的软件栈,上层是成千上万并不想自己管理基础设施的开发者和企业,中间出现一个越来越值钱的接口层,把“难以预测的资源”包装成“可调用的服务”。

再往前看,这也像 iPhone 之后的移动分发层重构。

不是说硅基流动等于 App Store,而是说一旦底层能力标准化速度不够快,上层应用需求又开始规模化,中间就会长出新的 control point。这个 control point 未必拥有最强模型,却可能拥有最真实的 usage data:哪些模型被调用、什么场景 churn 低、什么价格带最容易放量、哪个地区容量最紧。

而这些 usage data,反过来又会影响模型供给侧议价。

这就是 Grove 所说的 strategic inflection point 味道:旧问题是“有没有模型”;新问题是“谁控制模型流量的组织方式”。

如果这个判断成立,那么中国 AI infra 的下一阶段主线,就不只是训练侧、芯片侧、开源侧的故事,而是分发层有没有人先形成规模化 routing network

融资方名单也有点意思。

携程、金蝶、巨人网络、商汤、壁仞,不是同一类资本。这里面有场景方、有企业软件方、有上游算力/模型相关方、有互联网流量方。这类 cap table 通常说明一件事:它不再只是押注技术突破,而是在押注一个可被多种产业需求复用的 access layer

我没法仅凭一则快讯判断这些投资方后续会给出多少真实订单或资源协同,战投叙事经常被说得比落地更快;但从信号学上说,产业资本愿意同时下注,至少说明 token gateway 这层开始被当成基础设施节点看,而不只是 reseller。

04 对 AI builder 意味着什么

对 AI builder 来说,这条新闻不是看热闹。

是这周、这个月该改采购和架构决策的时候。

第一,不要再把 model access 当成一次性接入工程

如果你还在单绑一家模型 API,把 routing、fallback、缓存策略、价格切换都写死在业务代码里,你其实是在主动放弃 token economics 的套利空间。未来 6-12 个月,真正有利润空间的团队,往往不是训练了自己的模型,而是把多模型编排 + 成本治理 + SLA 控制做成了日常能力。

第二,重新审视“自建 vs 网关”的边界。

很多团队直觉上觉得,量上来以后应该 self-host 或直连原厂,省掉中间一层抽成。这个判断有时对,但不总对。因为你的真实成本不只是 inference bill,还包括:

  • 接入多个模型的人力成本
  • 容量波动时的服务损失
  • 海外区域合规与结算复杂度
  • prompt caching / batch / async queue 的工程投入
  • 模型版本升级带来的回归测试成本

如果网关层能把这些复杂性打包掉,抽成不一定是坏事。

我没看到硅基流动具体价格表,也没法替任何网关平台论证“必然更便宜”;但 builder 至少该做一件事:把总拥有成本从 token 单价,改成全链路交付成本来算

第三,关注“海外月营收数百万美元”背后的信号。

这说明出海团队并不一定非得直接去绑定美国原厂。对于想服务东南亚、中东、拉美、甚至多区域部署的团队,能做跨区域 routing、结算和稳定交付的平台,会越来越像默认基础设施。分发不是 sexy story,但往往最先形成 retention。

第四,如果你是 AI 应用创业者,要开始记录自己的模型切换能力

投资人和大客户接下来会越来越在意一件事:一旦 OpenAI、Anthropic、Google、Qwen、DeepSeek 的价格和效果继续剧烈波动,你是不是能在两周内迁移主要流量,而不是两个月。能切换,才有议价权;能路由,才有毛利空间。

第五,如果你本身就在做 developer tooling,这条新闻说明了另一个趋势:token abstraction 正在上移。未来 builder 不会只想买“模型”,而是想买“某类任务的最优调用结果”。这会把 observability、evaluation、policy layer、agent runtime 一起卷进来。单纯做 API 转售,长期 moat 很薄;但把 access 和 workflow 深度绑定,局面就不一样了。

05 反方观点 / 风险

我前面的判断,最大的风险是把“高速增长期的流量平台”误判成了“长期稳固的基础设施”。

这是很常见的错。

第一种反方观点是:这层根本没有 moat

OpenAI、Anthropic、Google 可以自己做 enterprise layer;阿里云、火山引擎、腾讯云可以把 MaaS 和云资源深度捆绑;大型企业客户则可能要求直连原厂或私有部署。这样一来,独立 token gateway 很容易被上下游双向压缩,只剩价格战。

这个反对意见很强,我认为不能轻视。

第二种风险在于,“数万亿 Token/日”不等于高质量收入

Token 量很大,可能来自低价模型、补贴换增长、内部测试流量,或者极低毛利的大客户。没有更细的数据,比如 gross margin、净收入留存、top 10 客户集中度、缓存命中率、算力采购结构,就很难判断这门生意到底是“规模先行”还是“利润可持续”。

我没看到这些关键经营指标,所以对 moat 的判断只能打折。

第三种风险是中国市场独有的供给扭曲。

如果本地开源模型持续降价,云厂商继续用 AI 做捆绑销售,独立平台可能被迫成为“透明管道”。一旦 access 被彻底 commoditized,最后赚到钱的是上游算力和下游强分发应用,中间层只承担运营复杂性,却拿不到对应利润。

第四种风险是监管与地缘结构。

海外营收数百万美元是好信号,但跨区域 model access 生意天然会碰到数据合规、出口限制、供应链不确定性。今天能 route 的模型,明天未必还能 route;今天能卖的区域,明天可能就要重做合规栈。这个变量足够大,大到可以直接吞掉中间层的效率优势。

所以更克制的结论是:

硅基流动这轮融资,不足以证明独立 MaaS / token gateway 已经建立长期 moat。

但它足以证明另一件更重要的事:AI 行业里,组织 Token 流量本身,已经成为一门足够大、足够快、足够值得资本和产业下注的生意。

这不是终局。

但很可能是中国 AI API 市场开始从“模型崇拜”,转向“分发与交付能力定价”的早期时刻。