Baseten 被定价的不是云

01 触发事件

2026 年 6 月 22 日，Bloomberg 报道 AI services startup Baseten 完成 15 亿美元 Series F，估值 130 亿美元；报道对它的定义很直接：向使用 lower-cost AI models 的公司提供 software and computing capacity。

Baseten CEO Tuhin Srivastava 和 Altimeter 合伙人 Apoorv Agrawal 共同出镜，这不是一笔安静的基础设施融资，而是刻意对外释放信号：市场愿意给“模型接入 + 算力调度”这一层更高倍数。

原文最关键的一句不是融资额，而是业务描述：

Baseten provides software and computing capacity to companies tapping into lower-cost AI models

这句话几乎把 Baseten 的战略位置说透了：它不只是卖 GPU，也不只是做 hosting；它在 lower-cost models 这条供给曲线上，试图占住应用与模型之间的交易入口。

我没在内部看过 Baseten 的 unit economics，所以没法断言这 130 亿美元估值是否便宜。但仅凭 Bloomberg 这个 framing，我认为资本市场正在给一类公司重新定价：不是 frontier model lab，也不是传统 cloud，而是 inference orchestration 层。

02 这事的真正含义

表面上，这是“又一家 AI infra 公司融资了”。

真正的含义是，模型市场正在从“谁训练出最强模型”转向“谁把足够好的模型，以足够低的总成本，足够稳定地送到开发者手里”。

问题不在模型是否继续进步，而在性能提升已经不再自动等于商业捕获。

当 Bloomberg 特别强调 lower-cost AI models，意思很明确：今天越来越多企业 workload 并不需要最强的 closed model。它们需要的是更低 token 成本、更可控 latency、更稳定吞吐、以及能在 OpenAI、Anthropic、Google、开源权重之间切换的能力。

这才是 Baseten 在说的事：AI 行业里开始出现“中间层价值回流”。

过去两年，市场叙事集中在训练端，谁有更多 H100、谁能做更大的 pretraining、谁能把 benchmark 再推高一点。现在，另一条曲线越来越重要：应用侧对 inference 成本、availability、regional compliance、custom deployment、KV cache 策略、batch 调度、routing policy 的敏感度正在上升。

这会带来一个很现实的结果：真正会被定价的，不只是模型 intelligence，而是 delivery economics。

如果企业采用“足够好”的 Qwen、Llama、Mistral、DeepSeek 系模型，或者 closed model 的廉价 tier，那么谁来解决以下问题？

哪个模型适合哪个请求
什么时候切换 provider
什么时候用 batch
什么时候做 prompt caching
哪些 workload 该走 dedicated capacity
如何避免被单一 API provider 卡脖子

Baseten 的高估值，至少说明一级市场相信：这些问题不会被基础模型公司自己完全吃掉。

我可能低估了 hyperscaler 复制这层能力的速度。Google Cloud、AWS、Azure 理论上都能把“模型接入 + 部署 + 调度”打包成标品。但资本现在愿意给 Baseten 高价，意味着市场认为独立层仍有窗口，尤其是在多模型、多云、多价格带并存的阶段。

换句话说，Baseten 被定价的不是“云”，而是 AI 时代的 capacity brokerage。

03 历史类比 / 结构对照

这让我想到两个历史切面。

第一个是 2014 年前后的 AWS 生态。

当时很多人以为云会吃掉所有基础设施利润，独立软件层只是过渡品。但真实发生的是：一旦底层算力商品化，新的控制点会转移到 orchestration、developer workflow、observability、security、deployment abstraction。Datadog、Snowflake、MongoDB、HashiCorp 都是这类逻辑的不同变体。AWS 很强，但没强到把每一层都拿走。

AI inference 今天有相似结构。

底层 GPU/TPU 越标准化，上层越有机会抽象 heterogeneity。尤其当模型本身变成可替换供给时，中间层不是变薄，反而可能变厚。因为替换性越高，routing 价值越大。

第二个类比是 2007 年 iPhone 之后的 aggregation shift。

不是每个硬件厂商都赢，真正赢的是控制 distribution 的平台。同理，AI 时代不一定是每个模型提供商都拿走利润。谁控制请求入口、开发者默认工作流、部署路径、和切换成本，谁就更像 aggregation layer。

Baseten 当然还远称不上 OpenAI 那种需求聚合器，它的 brand 和开发者 mindshare 不在一个量级。我可能在这里类比过度了。但结构上，Baseten 这种公司争夺的就是“默认推理入口”。

这也是为什么“低价模型”四个字很关键。

高价 frontier model 市场更像奢侈品，品牌、能力上限、闭源工具链更重要；低价模型市场更像大宗商品，比较的是每百万 token 成本、延迟、可定制性、是否支持私有部署、是否能吃掉某类固定 workload。在后者里，broker 的价值会被放大。

所以这不是一笔普通融资，而是一个信号：资本开始相信 AI 市场会分层，且中间层能从分层中获利。

04 对 AI builder 意味着什么

如果我是 AI builder，看到这条消息，短期要调整的不是产品叙事，而是采购和架构纪律。

第一，默认假设“单模型依赖”会越来越贵。

贵不只是 token 单价，还是 roadmap 依赖、rate limit、feature lock-in、区域可用性、以及 pricing policy 突变。既然市场在给 Baseten 这种 routing/capacity 层高估值，说明越来越多客户已经愿意为可切换性付费。那你至少要在系统设计上保留 model routing 的接口，不要把 prompt、tool schema、eval 全写死在单一 provider 上。

第二，把“模型选择”从战略问题降级成运营问题。

很多团队还在季度级别讨论“押 OpenAI 还是 Anthropic”。这在 2026 年已经有点慢了。更现实的做法是按任务拆分：高价值复杂任务给 Claude / GPT / Gemini 高端 tier，长尾任务交给 lower-cost open models 或廉价 API，能 batch 的 batch，能 cache 的 cache。

问题不在选哪家，而在有没有 routing system 去持续重算最优解。

第三，重新审视 self-hosting 与 gateway 的边界。

如果你有稳定、高量、任务分布清晰的 workload，自建或半自建 inference 栈可能开始成立，尤其是开源模型质量足够接近、且你能吃到 dedicated capacity 利润时。但如果你的量还不够大，或者需求波动剧烈，那么接入像 Baseten 这类平台，买的是调度能力和失败恢复，而不是单纯 GPU。

我没跑过你们的真实流量，所以这里不能一刀切。关键不是“开源一定更便宜”，而是 total serving cost 是否在你的请求结构下真的更优。

第四，采购团队和工程团队要一起盯 token economics。

未来 6-12 个月，应用层最大的套利窗口之一，不是做一个新 Agent UI，而是把现有 usage 重新分配到不同价格带模型，并通过 caching、prefix reuse、speculative decoding、batch API、异步队列把毛利拉出来。

这点经常被低估。很多 AI 产品不是死于没用户，而是死于 gross margin 从来没被设计过。

对像 OPCX.AI 这种 token gateway 视角更明显：客户最后不会只买“模型能力”，而是买“跨模型选择权”。选择权本身会变成产品。

05 反方观点 / 风险

最强反方其实很简单：Baseten 可能只是一级市场继续给 AI infra 高溢价，而不代表它真的拥有 durable moat。

130 亿美元估值听起来惊人，但如果 hyperscaler 把模型 hosting、serverless inference、private deployment、observability、routing 全部打包进原生云服务，独立平台的议价权会快速收缩。AWS、Google Cloud、Azure 历史上最擅长的就是把高毛利中间层压回基础设施套餐。

第二个风险是，frontier labs 可能主动下沉，把 Baseten 这类中间层最值钱的部分吃掉。

如果 OpenAI、Anthropic、Google 继续扩展自己的 enterprise controls、batch、cache、fine-tune hosting、agent runtime、regional deployment，客户未必还需要第三方 orchestration。尤其当模型 provider 同时拥有最好模型和最深 API feature 时，独立 routing 层的“中立”优势未必能转化为真实 distribution。

第三个风险来自开源模型本身。

如果 future open models 继续变强，同时部署工具链高度标准化，那么中间平台可能被挤压成低毛利 reseller。因为当 self-hosting 足够简单，broker 的价值会下降。今天 Baseten 被高估值支持，可能恰恰说明市场处于复杂度高、碎片化强的过渡期；但过渡期不等于终局。

我也可能误判了一个点：Baseten 的真正资产也许不是 routing，而是更深的 enterprise relationship、定制化部署能力、或者某些不在 Bloomberg 短报道里出现的 software layer。若如此，把它纯粹看成“capacity broker”会低估它。

但即便如此，这条新闻仍然值得重视。

因为它传递出的行业信号非常清楚：资本不再只为“最强模型”买单，也开始为“谁能把便宜模型稳定卖出去”买单。

这才是更大的拐点。

AI 市场正在从 intelligence scarcity，转向 delivery competition。

而一旦竞争点落到 delivery，pricing、routing、distribution、switching cost，就会比单次 benchmark 胜负更重要。

Baseten 被定价的不是云

01 触发事件

02 这事的真正含义

03 历史类比 / 结构对照

04 对 AI builder 意味着什么

05 反方观点 / 风险

相关推荐

AWS开始补上AI代理收费基础设施，真正难点正从模型转向结算

YC把“前10个客户”讲透了：早期获客靠创始人，不靠自动化工具

OpenRouter 上几乎找不到欧洲推理商，开源中文模型出海卡在合规与部署

STAR 把自动扩缩容做到容器级，AI 开始接管云成本里的细活

三星把 ChatGPT 和 Codex 推向全球员工，大企业 AI 进入集体上岗阶段

苹果把 AI 偷偷塞进 iPhone