BofA 在问谁买单

01 触发事件

2026-06-25，Bank of America 的欧洲股票策略负责人 Sebastian Raedler 因 Micron 的 blockbuster sales forecast 后，公开质疑科技股 rally 是否已经过头。

他抛出的关键问题很直接：谁来为这波资本开支买单？

我没在 BofA 内部跑过他们的 model，但这句话的含义比“估值贵了”更硬。它指向的是 AI 供给侧的现金流闭环。

表面上，这只是 Micron 受益于 AI memory demand，进而带动芯片股继续上冲。

真正的问题在于：AI 叙事里最容易被忽略的，不是 demand 有没有，而是 demand 能不能穿过 capex、depreciation、utilization、price compression 这四道门。

问题不在 Micron 卖得好，而在整个 AI stack 的利润池还没证明自己足以覆盖上游投资。

我没看到 Raedler 的完整模型，但我会把他的疑问翻成一句更残酷的话：

谁在为“推理更便宜”这件事提前付款？

现在的结构是：GPU、HBM、networking、datacenter、电力、土地、冷却系统，先把钱砸进去；然后模型 API、enterprise seat、agent workflow、广告或云分成再慢慢回收。

这中间任何一环都可能成为 bottleneck。

如果需求端的付费速度慢于供给端的扩张速度，最后被压缩的不是某一家厂商的毛利，而是整个 AI infra 链条的 multiple。

这才是 BofA 在说的事。

这像 2007 年 iPhone 刚带起移动互联网预期时，市场开始提前定价整条链条，但真正的价值分配后来并没有平均落到每个硬件和软件环节。

也像 2014 年 AWS 证明云是大生意之后，资本会本能地把“基础设施增长”外推成“所有基础设施公司都值得更高估值”。

问题是，市场常常把“行业 capex 上行”误读成“每一美元 capex 都能产生同等回报”。

我觉得今天 AI 也在经历同一件事，只是更快。

Micron 的强指引说明 memory 这一层已经吃到 AI 的真实订单；但这不自动证明最终 API 需求、agent 付费、企业 adoption，会以同样速度兑现。

这点我可能误判，但我更愿意把它看成一个 inflection point：从“缺供给”切到“看回报”。

对 API 消费者，先别把更高的 token 可得性当成长期宽松。

如果上游继续扩 capex，模型厂商会更在意 utilization、batching、prompt caching、KV cache 命中率，以及 routing 到更便宜模型的能力。

对 startup 创始人，毛利不是唯一指标，现金回收周期开始变得更重要。

能把 inference 成本压到更低、把同样 token 变成更高 ARPU 的产品，会比“纯调用大模型”的应用更安全。

对 infra / gateway 类公司，这是 routing 和 pricing 的窗口期。

当上游价格、延迟、上下文长度、batch 折扣频繁变化时，谁能持续做模型选择、成本套利和 SLA 管控，谁就更接近 distribution layer。

我没法断言这个窗口会开多久，但它不会无限期存在。

我可能错在两点。

第一，市场也许根本没在定价“所有 capex 都会回本”，而是在定价少数赢家的超额利润。那样的话，贵的不是科技板块，而是我对“平均回报率”的假设。

第二，AI 需求也许比我想得更接近平台型扩张：一旦 enterprise workflow、coding、search、agent 真正嵌进去，utilization 会反过来抬高资本效率，capex 压力会被收入增长吞掉。

但如果这次不是“更多投资带来更多确定性”，而是“更多投资提前透支未来回报”，那 BofA 这句问话就不是噪音。

它是泡沫里最早出现的现金流问题。