01 触发事件
2026 年 6 月 22 日,Bloomberg 报道 AI services startup Baseten 完成 15 亿美元 Series F,估值 130 亿美元;报道对它的定义很直接:向使用 lower-cost AI models 的公司提供 software and computing capacity。
Baseten CEO Tuhin Srivastava 和 Altimeter 合伙人 Apoorv Agrawal 共同出镜,这不是一笔安静的基础设施融资,而是刻意对外释放信号:市场愿意给“模型接入 + 算力调度”这一层更高倍数。
原文最关键的一句不是融资额,而是业务描述:
Baseten provides software and computing capacity to companies tapping into lower-cost AI models
这句话几乎把 Baseten 的战略位置说透了:它不只是卖 GPU,也不只是做 hosting;它在 lower-cost models 这条供给曲线上,试图占住应用与模型之间的交易入口。
我没在内部看过 Baseten 的 unit economics,所以没法断言这 130 亿美元估值是否便宜。但仅凭 Bloomberg 这个 framing,我认为资本市场正在给一类公司重新定价:不是 frontier model lab,也不是传统 cloud,而是 inference orchestration 层。
02 这事的真正含义
表面上,这是“又一家 AI infra 公司融资了”。
真正的含义是,模型市场正在从“谁训练出最强模型”转向“谁把足够好的模型,以足够低的总成本,足够稳定地送到开发者手里”。
问题不在模型是否继续进步,而在性能提升已经不再自动等于商业捕获。
当 Bloomberg 特别强调 lower-cost AI models,意思很明确:今天越来越多企业 workload 并不需要最强的 closed model。它们需要的是更低 token 成本、更可控 latency、更稳定吞吐、以及能在 OpenAI、Anthropic、Google、开源权重之间切换的能力。
这才是 Baseten 在说的事:AI 行业里开始出现“中间层价值回流”。
过去两年,市场叙事集中在训练端,谁有更多 H100、谁能做更大的 pretraining、谁能把 benchmark 再推高一点。现在,另一条曲线越来越重要:应用侧对 inference 成本、availability、regional compliance、custom deployment、KV cache 策略、batch 调度、routing policy 的敏感度正在上升。
这会带来一个很现实的结果:真正会被定价的,不只是模型 intelligence,而是 delivery economics。
如果企业采用“足够好”的 Qwen、Llama、Mistral、DeepSeek 系模型,或者 closed model 的廉价 tier,那么谁来解决以下问题?
- 哪个模型适合哪个请求
- 什么时候切换 provider
- 什么时候用 batch
- 什么时候做 prompt caching
- 哪些 workload 该走 dedicated capacity
- 如何避免被单一 API provider 卡脖子
Baseten 的高估值,至少说明一级市场相信:这些问题不会被基础模型公司自己完全吃掉。
我可能低估了 hyperscaler 复制这层能力的速度。Google Cloud、AWS、Azure 理论上都能把“模型接入 + 部署 + 调度”打包成标品。但资本现在愿意给 Baseten 高价,意味着市场认为独立层仍有窗口,尤其是在多模型、多云、多价格带并存的阶段。
换句话说,Baseten 被定价的不是“云”,而是 AI 时代的 capacity brokerage。
03 历史类比 / 结构对照
这让我想到两个历史切面。
第一个是 2014 年前后的 AWS 生态。
当时很多人以为云会吃掉所有基础设施利润,独立软件层只是过渡品。但真实发生的是:一旦底层算力商品化,新的控制点会转移到 orchestration、developer workflow、observability、security、deployment abstraction。Datadog、Snowflake、MongoDB、HashiCorp 都是这类逻辑的不同变体。AWS 很强,但没强到把每一层都拿走。
AI inference 今天有相似结构。
底层 GPU/TPU 越标准化,上层越有机会抽象 heterogeneity。尤其当模型本身变成可替换供给时,中间层不是变薄,反而可能变厚。因为替换性越高,routing 价值越大。
第二个类比是 2007 年 iPhone 之后的 aggregation shift。
不是每个硬件厂商都赢,真正赢的是控制 distribution 的平台。同理,AI 时代不一定是每个模型提供商都拿走利润。谁控制请求入口、开发者默认工作流、部署路径、和切换成本,谁就更像 aggregation layer。
Baseten 当然还远称不上 OpenAI 那种需求聚合器,它的 brand 和开发者 mindshare 不在一个量级。我可能在这里类比过度了。但结构上,Baseten 这种公司争夺的就是“默认推理入口”。
这也是为什么“低价模型”四个字很关键。
高价 frontier model 市场更像奢侈品,品牌、能力上限、闭源工具链更重要;低价模型市场更像大宗商品,比较的是每百万 token 成本、延迟、可定制性、是否支持私有部署、是否能吃掉某类固定 workload。在后者里,broker 的价值会被放大。
所以这不是一笔普通融资,而是一个信号:资本开始相信 AI 市场会分层,且中间层能从分层中获利。
04 对 AI builder 意味着什么
如果我是 AI builder,看到这条消息,短期要调整的不是产品叙事,而是采购和架构纪律。
第一,默认假设“单模型依赖”会越来越贵。
贵不只是 token 单价,还是 roadmap 依赖、rate limit、feature lock-in、区域可用性、以及 pricing policy 突变。既然市场在给 Baseten 这种 routing/capacity 层高估值,说明越来越多客户已经愿意为可切换性付费。那你至少要在系统设计上保留 model routing 的接口,不要把 prompt、tool schema、eval 全写死在单一 provider 上。
第二,把“模型选择”从战略问题降级成运营问题。
很多团队还在季度级别讨论“押 OpenAI 还是 Anthropic”。这在 2026 年已经有点慢了。更现实的做法是按任务拆分:高价值复杂任务给 Claude / GPT / Gemini 高端 tier,长尾任务交给 lower-cost open models 或廉价 API,能 batch 的 batch,能 cache 的 cache。
问题不在选哪家,而在有没有 routing system 去持续重算最优解。
第三,重新审视 self-hosting 与 gateway 的边界。
如果你有稳定、高量、任务分布清晰的 workload,自建或半自建 inference 栈可能开始成立,尤其是开源模型质量足够接近、且你能吃到 dedicated capacity 利润时。但如果你的量还不够大,或者需求波动剧烈,那么接入像 Baseten 这类平台,买的是调度能力和失败恢复,而不是单纯 GPU。
我没跑过你们的真实流量,所以这里不能一刀切。关键不是“开源一定更便宜”,而是 total serving cost 是否在你的请求结构下真的更优。
第四,采购团队和工程团队要一起盯 token economics。
未来 6-12 个月,应用层最大的套利窗口之一,不是做一个新 Agent UI,而是把现有 usage 重新分配到不同价格带模型,并通过 caching、prefix reuse、speculative decoding、batch API、异步队列把毛利拉出来。
这点经常被低估。很多 AI 产品不是死于没用户,而是死于 gross margin 从来没被设计过。
对像 OPCX.AI 这种 token gateway 视角更明显:客户最后不会只买“模型能力”,而是买“跨模型选择权”。选择权本身会变成产品。
05 反方观点 / 风险
最强反方其实很简单:Baseten 可能只是一级市场继续给 AI infra 高溢价,而不代表它真的拥有 durable moat。
130 亿美元估值听起来惊人,但如果 hyperscaler 把模型 hosting、serverless inference、private deployment、observability、routing 全部打包进原生云服务,独立平台的议价权会快速收缩。AWS、Google Cloud、Azure 历史上最擅长的就是把高毛利中间层压回基础设施套餐。
第二个风险是,frontier labs 可能主动下沉,把 Baseten 这类中间层最值钱的部分吃掉。
如果 OpenAI、Anthropic、Google 继续扩展自己的 enterprise controls、batch、cache、fine-tune hosting、agent runtime、regional deployment,客户未必还需要第三方 orchestration。尤其当模型 provider 同时拥有最好模型和最深 API feature 时,独立 routing 层的“中立”优势未必能转化为真实 distribution。
第三个风险来自开源模型本身。
如果 future open models 继续变强,同时部署工具链高度标准化,那么中间平台可能被挤压成低毛利 reseller。因为当 self-hosting 足够简单,broker 的价值会下降。今天 Baseten 被高估值支持,可能恰恰说明市场处于复杂度高、碎片化强的过渡期;但过渡期不等于终局。
我也可能误判了一个点:Baseten 的真正资产也许不是 routing,而是更深的 enterprise relationship、定制化部署能力、或者某些不在 Bloomberg 短报道里出现的 software layer。若如此,把它纯粹看成“capacity broker”会低估它。
但即便如此,这条新闻仍然值得重视。
因为它传递出的行业信号非常清楚:资本不再只为“最强模型”买单,也开始为“谁能把便宜模型稳定卖出去”买单。
这才是更大的拐点。
AI 市场正在从 intelligence scarcity,转向 delivery competition。
而一旦竞争点落到 delivery,pricing、routing、distribution、switching cost,就会比单次 benchmark 胜负更重要。