01 触发事件
2025 年,腾讯云在 AI 产业应用大会上披露:TokenHub 上线 3 个月,保持每月翻倍增长,目前日 Token 消耗量突破 5 万亿。
这条消息表面上是在说一个平台增长很快。
但如果只把它理解成“腾讯云也在做大模型平台,而且数据不错”,就看浅了。
5 万亿/day 这个数字的意义,不在新闻感,而在它把一个过去相对模糊的层级,第一次用足够具体的 usage 信号钉住了:模型网关正在变成独立的基础设施品类。
我没在腾讯云内部看过这 5 万亿 Token 的构成,所以没法确认其中有多少来自 training-adjacent workload、多少是纯 inference、多少是内部生态导流。但仅从披露方式看,腾讯云刻意强调的不是某个单模型胜率,也不是 benchmark,而是聚合后的 Token 吞吐。
这才是它在说的事。
5 万亿 Token/day
这不是单一模型的荣耀时刻,而是 demand aggregation 规模被公开量化的时刻。
对 AI builder 来说,这种数字的信号强度很高。因为一旦平台方开始披露总 Token 消耗,而不是只讲“接入了多少模型、服务了多少客户”,说明竞争已经从 catalogue competition 进入了 flow competition:谁控制请求流,谁就更接近利润池。
02 这事的真正含义
问题不在腾讯云有没有拿到一个漂亮增长曲线,而在 TokenHub 这种平台正在从 access layer 升级成 market-making layer。
过去很多人把模型网关理解成“帮你统一接 OpenAI、Anthropic、Google、DeepSeek、Qwen 的 API 适配器”。这当然有价值,但不是 moat。适配是 feature,不是 business。
真正的价值来自三件事:
第一,distribution。
开发者并不天然忠于模型厂商,他们忠于默认入口、稳定 SLA、结算便利性、以及迁移 friction。谁先拿到开发者侧和企业侧的默认入口,谁就有资格决定流量先到谁那里,再转给哪家模型。
第二,routing。
当模型能力越来越接近,价格和延迟成为核心变量时,网关不再只是转发请求,而是替用户做实时交易决策:什么请求走高性能模型,什么请求走低成本模型,什么请求启用 prompt caching,什么请求进 batch API,什么请求压缩 context。
第三,结算与信用中介。
企业不愿意跟十几家模型厂商逐一签约、预充值、过法务、做合规、跑审计。越是大客户,越需要一个统一的 token clearing layer。这个角色一旦坐稳,switching cost 就会上升,而且上升得比大家想象快。
我可能误判的一点是,腾讯云这 5 万亿/day 里,未必全部代表高质量、可持续的外部客户需求。有可能相当一部分来自腾讯云现有 B 端客户迁移、生态伙伴导流,甚至某些促活型 workload。
但即便打折看,这个披露仍然很关键。
因为它说明一件事:中国云厂商已经不满足于做 GPU 租赁商,也不满足于做模型托管商,而是在争夺 AI 请求的统一入口。
这和传统 cloud 的区别很大。
IaaS 时代,云厂商卖的是 compute、storage、network。
模型 API 时代,云厂商想卖的是 token flow。
那个真正会被定价的,不只是每百万 Token 的单价,而是“我能不能把你的请求路由到更便宜、更快、或者更可控的模型,同时把这件事做得足够无感”。
如果做得到,平台就可以吃到 spread。
这和支付行业、广告交易平台、云分发网络都更像,而不只是“AI 版云市场”。
03 历史类比 / 结构对照
这件事最像的,不是 2022 年 ChatGPT 爆红。
它更像 2014 年之后 AWS 在云生态里发生的结构变化:一开始大家以为 AWS 的价值在算力租赁,后来发现真正强的是它把企业默认部署路径、采购流程、开发者心智和增值服务全包了。
AI 领域现在也在重复这个过程。
最早的竞争是 model competition:谁参数大、谁 benchmark 高、谁发布更快。
接下来会进入 platform competition:谁能把异构模型、异构硬件、异构价格体系包装成一个可消费的接口。
再往后会进入 aggregation competition:谁掌握足够多的下游请求,能够反向约束上游供给。
这是 Stratechery 那套 aggregation theory 在 AI API 市场的直接体现。
模型厂商理论上拥有供给侧稀缺性,但如果需求侧被网关平台聚合,供给方就会逐渐被平台化。尤其当下游用户更在意 cost/performance ratio,而不是“必须用某一家原厂 API”时,平台的议价能力会抬升。
我没拿到腾讯云和具体模型厂商之间的分成或保底协议,所以不能断言 TokenHub 已经形成对上游的强议价能力。但方向已经很清楚:谁先掌握需求聚合,谁就有机会把模型变成可替代供给。
这里还有一个更早的类比:移动互联网早期的 app store。
开发者以为自己在为用户提供服务,最后发现分发入口决定生死。
今天模型厂商也可能遇到类似局面:你当然能训练出更好的模型,但如果开发者不直接来你这里,而是通过云平台、IDE、agent framework、企业采购平台调用你,你的品牌价值会被中介层稀释。
这就是结构性矛盾。
上游想保留品牌和 pricing power,下游想抽象成 interchangeable capacity,中间层则想吃掉控制权。
腾讯云披露 5 万亿/day,重要的不是这个数字是否已经能和全球头部 API 平台相比,而是它证明中国市场也进入了这场控制权争夺。
04 对 AI builder 意味着什么
对 AI builder,这不是围观看热闹的新闻,而是这周就该调整决策的信号。
第一,不要再把“直连单一模型厂商”当成默认架构。
如果你的产品已经有一定 Token 消耗规模,或者你在做 agent、code generation、search、客服、内容生产这类高频 inference 业务,就该认真设计 model routing。不是为了炫技,而是为了活下来。
因为模型能力差距在缩小,价格差距、限流策略、上下文定价、缓存命中率差异,会比 benchmark 排名更影响毛利。
第二,把网关层视为战略资产,而不是临时中间件。
你可以自建,也可以接第三方,但不要没有。原因很简单:没有网关层,你就没有统一的 observability、fallback、灰度、成本控制和供应商切换能力。
换句话说,没有这一层,你的 switching cost 不是对供应商施加的,而是供应商施加给你的。
第三,重新评估 cloud provider 在 AI 栈中的位置。
过去很多创业团队把云厂商视为基础设施背景板:买 GPU、买数据库、买 CDN。
现在不是了。
云厂商正在变成 AI 流量交易所、结算方、分发渠道,甚至可能进一步变成应用生态入口。尤其当它们同时拥有企业销售网络、私有化交付能力、合规资源和自家模型/开源模型托管能力时,它们对中大型客户的吸引力会持续增强。
第四,尽快把自己的 token economics 算清楚。
5 万亿/day 这类数字,会刺激更多平台打价格战、补贴战、返佣战、套餐战。这对客户短期有利,但也会制造错觉:你以为自己的 unit economics 成立,实际上只是吃到了平台阶段性补贴。
我没法确认腾讯云当前是否在用显著补贴换规模,但这是所有聚合平台的常见路径。Builder 最容易犯的错,是把临时价格当永久价格。
所以现在就该做三套模型:
- 原价情况下的 gross margin
- 主要供应商涨价 20% 后的 gross margin
- 最优 routing 失效后的 gross margin
如果这三套都撑不住,你的商业模式就不是 AI 原生,而是补贴原生。
05 反方观点 / 风险
我前面的判断,最大的风险是:把一个 PR 信号误读成结构拐点。
首先,5 万亿 Token/day 只说明吞吐,不说明质量。
它不等于高 ARPU,不等于高留存,不等于高净收入,也不等于这些 Token 来自真正有长期付费意愿的客户。Token 规模很容易被大 context、低质量生成、测试流量、内部生态 workload 放大。
其次,网关层不一定天然有 moat。
如果模型厂商继续强化 first-party SDK、原生 agent 平台、深度集成 IDE、企业合同优惠和更强的 prompt caching/batch API 机制,很多高价值客户可能绕过聚合层,直接和上游绑定。尤其当上游把“最低价只给直连客户”变成常态时,第三方网关的 spread 会被压缩。
第三,云厂商做网关,未必比独立平台更强。
云厂商的优势是销售、基础设施、企业关系;劣势是产品中立性、跨云兼容、以及对外部模型厂商的天然竞争关系。你让一家云厂商做最中立的 model broker,这件事在组织上并不轻松。我没在腾讯云内部跑过它的合作机制,所以这点我可能误判。
第四,中国市场和美国市场未必会走同一路径。
美国的模型供给更集中,原厂 API 品牌更强,开发者工具生态更成熟;中国市场则更可能由云厂商、大厂生态和行业方案商共同切分。结果未必是单一 aggregation winner,也可能是多个垂直网关并存。
所以更保守的结论是:
腾讯云这次披露,未必证明 TokenHub 已经赢了。
但它足以证明,模型网关不再是边角料,而是主战场。
这才是值得记住的部分。
如果未来两年 AI API 市场真的形成新的利润池,我倾向于认为,先拿到需求聚合和 routing 控制权的平台,会比单纯拥有几个热门模型接入权的平台更值钱。问题不在“有没有模型”,而在“谁定义默认调用路径”。
而 5 万亿/day,正是这场战争第一次被摆到台面上的计数器。