01 触发事件

2026-06-25,Bank of America 的欧洲股票策略负责人 Sebastian Raedler 因 Micron 的 blockbuster sales forecast 后,公开质疑科技股 rally 是否已经过头。

他抛出的关键问题很直接:谁来为这波资本开支买单?

我没在 BofA 内部跑过他们的 model,但这句话的含义比“估值贵了”更硬。它指向的是 AI 供给侧的现金流闭环。

02 这事的真正含义

表面上,这只是 Micron 受益于 AI memory demand,进而带动芯片股继续上冲。

真正的问题在于:AI 叙事里最容易被忽略的,不是 demand 有没有,而是 demand 能不能穿过 capex、depreciation、utilization、price compression 这四道门。

问题不在 Micron 卖得好,而在整个 AI stack 的利润池还没证明自己足以覆盖上游投资。

我没看到 Raedler 的完整模型,但我会把他的疑问翻成一句更残酷的话:

谁在为“推理更便宜”这件事提前付款?

现在的结构是:GPU、HBM、networking、datacenter、电力、土地、冷却系统,先把钱砸进去;然后模型 API、enterprise seat、agent workflow、广告或云分成再慢慢回收。

这中间任何一环都可能成为 bottleneck。

如果需求端的付费速度慢于供给端的扩张速度,最后被压缩的不是某一家厂商的毛利,而是整个 AI infra 链条的 multiple。

这才是 BofA 在说的事。

03 历史类比 / 结构对照

这像 2007 年 iPhone 刚带起移动互联网预期时,市场开始提前定价整条链条,但真正的价值分配后来并没有平均落到每个硬件和软件环节。

也像 2014 年 AWS 证明云是大生意之后,资本会本能地把“基础设施增长”外推成“所有基础设施公司都值得更高估值”。

问题是,市场常常把“行业 capex 上行”误读成“每一美元 capex 都能产生同等回报”。

我觉得今天 AI 也在经历同一件事,只是更快。

Micron 的强指引说明 memory 这一层已经吃到 AI 的真实订单;但这不自动证明最终 API 需求、agent 付费、企业 adoption,会以同样速度兑现。

这点我可能误判,但我更愿意把它看成一个 inflection point:从“缺供给”切到“看回报”。

04 对 AI builder 意味着什么

对 API 消费者,先别把更高的 token 可得性当成长期宽松。

如果上游继续扩 capex,模型厂商会更在意 utilization、batching、prompt caching、KV cache 命中率,以及 routing 到更便宜模型的能力。

对 startup 创始人,毛利不是唯一指标,现金回收周期开始变得更重要。

能把 inference 成本压到更低、把同样 token 变成更高 ARPU 的产品,会比“纯调用大模型”的应用更安全。

对 infra / gateway 类公司,这是 routing 和 pricing 的窗口期。

当上游价格、延迟、上下文长度、batch 折扣频繁变化时,谁能持续做模型选择、成本套利和 SLA 管控,谁就更接近 distribution layer。

我没法断言这个窗口会开多久,但它不会无限期存在。

05 反方观点 / 风险

我可能错在两点。

第一,市场也许根本没在定价“所有 capex 都会回本”,而是在定价少数赢家的超额利润。那样的话,贵的不是科技板块,而是我对“平均回报率”的假设。

第二,AI 需求也许比我想得更接近平台型扩张:一旦 enterprise workflow、coding、search、agent 真正嵌进去,utilization 会反过来抬高资本效率,capex 压力会被收入增长吞掉。

但如果这次不是“更多投资带来更多确定性”,而是“更多投资提前透支未来回报”,那 BofA 这句问话就不是噪音。

它是泡沫里最早出现的现金流问题。