## 01 触发事件 2025 年 9 月,The Verge 援引纽约时报和 CNBC 报道:SpaceX 计划在美国德州 Austin 附近建设名为 Terafab 的 AI 芯片工厂,首期投资至少 550 亿美元;如果后续阶段全部落地,总投资可能升至 1190 亿美元。 公开听证文件显示,SpaceX 正为该项目申请 tax breaks。 更关键的数字不是 550 亿美元本身,而是马斯克在今年 3 月最早披露的目标:Terafab 最终要支撑每年最高 200 gigawatts 的 computing capacity。这个表述很不寻常,因为它不是按“多少颗芯片”“多少 wafer”来讲,而是按 power envelope 来讲。 这说明它瞄准的不是一个普通 semiconductor fab 叙事,而是 AI compute 基础设施叙事。 我没在内部看过这份 hearing filing 的完整技术附件,所以不能确认 Terafab 到底是先进封装、完整制造、还是更偏系统级集成;但仅从公开口径看,SpaceX 想切入的不是边缘环节,而是 supply chain 的核心节点。 公开听证文件:SpaceX 申请税收优惠,Terafab 首期至少 550 亿美元,后续阶段总额可达 1190 亿美元 如果这个数字最后大幅缩水,我不会意外。可即便打七折,它依然是一个足以改变市场预期的 capex 信号。 ## 02 这事的真正含义 表面上看,这是“又一家马斯克系公司想做 AI 芯片”。 这不是重点。 真正的含义是:AI 行业的约束条件,正在从模型能力竞争,转向 compute supply 的组织方式竞争。谁能更稳定地拿到电力、土地、封装、冷却、网络和资本,谁就更可能定义下一轮模型供给曲线。 过去两年,市场默认的分工是这样的:NVIDIA 提供加速器,TSMC 负责制造,云厂商负责集群,模型公司购买或租赁算力,再向开发者卖 token。 SpaceX 这个动作挑战的是这条链条的中间假设:是不是一定要接受现成 supply chain。 如果答案是否定的,那么 AI 行业会越来越像早期铁路、石油、云计算,而不是传统 SaaS。价值不只在模型权重,也在于你能否控制“流量经过的物理管道”。 这才是这件事在说的事。 尤其是当项目描述直接用 gigawatts 衡量时,问题就不再是“能不能做出比 NVIDIA 更好的芯片”,而是“能不能把 compute 变成可工业化复制的能源负载”。一旦这么看,chip 只是系统的一部分,真正被定价的是 end-to-end delivered compute。 我可能误判的一点是,SpaceX 也许并不打算成为一个对外开放的 merchant supplier,而只是为 xAI 或马斯克生态做 captive capacity。若是后者,这对开放市场的直接供给增量会小很多。 但即便如此,它仍会对价格体系产生外溢影响。因为每一个超大规模自建项目,都会让现有 cloud GPU 租赁模式的稀缺性叙事变弱。 这和 token economics 有直接关系。 今天 API buyer 真正在买的,不只是 intelligence,而是背后的供给稳定性:延迟会不会飘,batch API 折扣能不能持续,长 context 会不会突然涨价,prompt caching 能不能长期兑现。供给端一旦出现新的超大资本玩家,未来 12 到 24 个月里,最先被压缩的往往不是 frontier model 的 headline price,而是中高端 inference 的毛利空间。 ## 03 历史类比 / 结构对照 更好的类比不是某家芯片创业公司融了大钱。 更像 2014 年 AWS 从“开发者便利工具”跨入“企业默认计算底座”的时刻。 当时很多人把 AWS 看成便宜服务器租赁服务,但它真正完成的是一件更深的事:把计算资源从企业内部固定资产,变成按需购买的公用能力。它重构了 software stack 上层的商业组织方式。 今天 AI compute 也在经历相反方向的重构:从云上抽象资源,重新回到物理世界的垂直控制。 这听上去像倒退,其实不是。 因为生成式 AI 的 economics 和传统 web workload 不同。训练与推理都高度依赖 power density、interconnect、memory bandwidth、cooling、网络拓扑、KV cache 命中率,以及负载调度。你可以在 API 层做 model routing,在 serving 层做 caching,在架构层押注 MoE 或 MLA,但到最后,电和封装仍然会回来收税。 这很像 2008 年金融危机后市场重新意识到“流动性不是抽象概念,而是资产负债表能力”。AI 行业现在也在经历类似时刻:compute availability 不是 abstract capacity,而是 capex、土地、电力和供应链协同能力。 如果 AI 的瓶颈从算法转向交付,那么最有价值的公司未必是最会训练模型的公司,而是最会组织 compute 的公司 我没法确认 SpaceX 是否真的有能力在先进半导体制造上穿透现有 incumbents 的工艺壁垒。TSMC、Samsung、Intel 不是说绕就能绕过去的。 但这件事未必要以“成功量产领先芯片”作为唯一成功标准。 只要它推动一种认知转变——AI 计算必须像能源和工业品一样被系统性组织——它就已经在改变竞争格局。 ## 04 对 AI builder 意味着什么 对 builder 来说,这不是一条适合围观的新闻,而是一条应该进入采购和架构决策表的新闻。 第一,重新评估单一模型供应商依赖。 如果 compute 供给进入垂直整合周期,那么闭源模型厂商未来的 pricing 变化可能会更剧烈,而不是更稳定。今天便宜,不代表明天还有同样 margin 结构。我的看法是,2025 到 2026 年更稳妥的策略仍然是多供应商接入、保留 routing 层、把 prompt 和 tool schema 做可迁移设计。 第二,别把 token price 当成唯一变量。 真正重要的是 effective cost per successful task。包括首 token latency、长上下文衰减、缓存命中、tool call 稳定性、rate limit、输出长度波动。未来如果供给更充裕,headline input/output price 会下降,但不同平台在真实 workload 上的 delivered economics 差异会更大。 这也是 opcx 这类网关平台存在的根本原因:你不是在买“最低单价”,你是在买跨模型、跨时段、跨负载形态的最优路由权。 第三,关注 power-rich geography,而不是只关注 leaderboard。 德州、阿布扎比、东南亚部分节点、以及有能源套利空间的数据中心集群,可能会比又一个 benchmark 第一名更值得看。因为能拿到电、能部署 rack、能控制冷却和网络的地方,会先出现价格异常点。 第四,应用层窗口还在,但打法要变。 不是去赌“最好模型”,而是去赌“哪类任务会最先 commoditize”。例如代码补全、文档总结、客服草稿这类高频推理任务,一旦供给扩张,价格很可能被快速打穿。反而是需要高 reliability、多步骤 tool use、企业内部 data integration 的工作流,更容易保住毛利和 switching cost。 我可能低估的一点是,如果 SpaceX 这种项目建设周期极长,那么 builder 在未来 12 个月内感受到的仍然主要是现有几家云厂商和 frontier labs 的 pricing 战,而不是新增产能本身。换言之,信号是真的,兑现可能很慢。 但战略上,慢兑现不等于没影响。 市场通常会先根据未来供给预期重估定价权,然后才等工厂真正投产。 ## 05 反方观点 / 风险 最强的反方观点其实很直接:这可能只是马斯克式超大叙事,又一个把长期愿景写到公共文件里的项目,最后未必按原路径落地。 550 亿到 1190 亿美元不是正常试错规模。 它更像一个政治、财政、土地、电力、供应链一起协同的 mega-project。任何一个环节卡住,时间表都会失真。尤其半导体制造不是火箭,也不是数据中心。先进工艺、EUV、材料、良率、封装、测试,每一层都不是 SpaceX 靠工程文化就能快速复制的。 第二个风险是,市场会把“AI 芯片厂”四个字自动脑补成“NVIDIA 替代者”。 我认为这是误读。 就算项目最终落地,它也更可能先从某个特定层切入:先进封装、系统集成、特定 accelerator、或者 xAI 自用 compute module,而不是一步到位成为通用 GPU 供应商。如果是这样,它对开放 API 市场的短期影响会被夸大。 第三个风险在于需求侧。 今天大家默认 AI compute 需求会线性上升,但这未必成立。如果 frontier model 的能力提升放缓,或者推理效率因 MoE、KV cache 优化、编译器、模型蒸馏而快速改善,那么巨额 capex 的回收周期会被拉长。问题不在能不能建出来,而在建出来后利用率如何。 如果推理成本曲线下降得比需求增长更快,今天看似短缺的 compute,三年后可能变成结构性过剩 我没在内部跑过 SpaceX/xAI 的需求模型,所以这点我可能误判。 但也正因此,我不会把这条新闻解读成“AI 供给必然无限紧张”的证据。更准确地说,它是一个强烈信号:最有资本、最能组织工程资源的人,已经开始假设 compute 会成为决定胜负的一级战场。 这不是结论。 这是拐点前夜常见的资本姿态。