Article Not Found

01 触发事件

2025 年，百度正式发布文心大模型 5.1。按 36 氪转述的官方口径，文心 5.1 采用“多维弹性预训练”技术，仅以业界同规模模型约 6% 的预训练成本，达到“基础效果领先水平”，并登上 LMArena 搜索榜国内第一。

这是一条短新闻，但信息密度并不低。

先把三个关键信号拆开看：第一，百度强调的是“新一代基础大模型”，不是单一场景模型；第二，百度主动给出“约 6% 的预训练成本”这个极强数字；第三，它用的是 LMArena 搜索榜国内第一这种偏外部评测话术，而不是只讲内部 benchmark。

我没在内部跑过文心 5.1，也没见到完整 technical report，所以这里必须先做一个 hedge：现在还不能把“6% 成本”直接等价成对所有训练环节、所有 token 规模、所有 downstream 能力都成立的事实。它更可能是百度有意选择的比较口径。

但即便保守看，这条新闻真正值得盯的，不是“百度又发了个模型”，而是百度选择把“成本效率”推到台前。

36 氪获悉，百度正式发布新一代基础大模型文心大模型 5.1。据官方介绍，文心 5.1采用“多维弹性预训练”技术，仅以业界同规模模型约6%的预训练成本，达到基础效果领先水平，登上LMArena搜索榜国内第一。

02 这事的真正含义

这才是百度在说的事：基础模型市场的竞争指标，正在从“谁更强”转向“谁能以更低成本把足够强的能力稳定供给出去”。

问题不在文心 5.1 有没有再刷一个榜，而在百度是否试图重写市场的比较维度。

过去一年，模型公司最爱讲的是三件事：benchmark、长 context、Agent 能力。现在百度把叙事重心放到预训练成本，等于在提醒市场一个更残酷的现实：如果能力差距没有大到形成压倒性 moat，那么最后会被定价的不是参数量，而是成本曲线。

尤其对中国市场，这个信号更重要。

原因很直接。中国模型供给侧比很多人想得更拥挤：百度、阿里、腾讯、字节、智谱、月之暗面、DeepSeek、MiniMax 以及一批垂直模型团队，都在争企业预算、开发者入口和云资源绑定。能力差距存在，但在大量通用 API 场景里，还没有大到让客户完全无视价格、延迟、吞吐和 deployment 便利性。

于是，谁先证明自己能把训练成本和后续推理成本一起压下来，谁就更有机会在 API 层、私有化层、行业解决方案层打组合拳。

我可能会误判的一点是：新闻里只写了“预训练成本约 6%”，没有给出 inference efficiency、KV cache 占用、吞吐、长上下文退化、post-training 成本等更关键指标。对 API 消费者来说，训练省钱不自动等于调用便宜，也不自动等于总拥有成本更低。

但商业上，百度已经先抢了一步：它把“便宜但不差”包装成了一种可信战略，而不是不得已的防守姿态。

这背后还有第二层含义：大厂重新把模型当作 cloud leverage，而不是单独的明星产品。

如果一个模型能在训练阶段就显著省算力，那它的意义不只是节省 capex。它还意味着更快迭代、更高试错频率、更容易把模型能力嵌进搜索、广告、云、Agent 平台与企业服务。模型本身未必是利润中心，但它可以放大 distribution。

这也是为什么“6% 成本”是个战略数字，不只是技术数字。

03 历史类比 / 结构对照

这件事更像 2014 年前后的 AWS，而不是 2022 年的 ChatGPT。

ChatGPT 时刻的核心是需求爆发：一个足够好的产品把整个行业拉进新范式。AWS 时刻的核心则是供给标准化：计算资源被产品化、价格化、规模化，最后赢家不是最会讲技术故事的人，而是最能把复杂能力做成稳定服务的人。

百度这次如果真能把“同规模模型 6% 训练成本”兑现到产品层，那么它对应的不是 iPhone 式的体验拐点，而是更像云计算史上的成本/效率拐点。

历史上，这类拐点有一个共同模式：上游一旦把单位成本打下来，下游创新会突然变得密集。

2008 年后的 AWS 降价，让一批此前不成立的 SaaS 公司成立了。今天如果基础模型成本持续下降，成立的不是“更多聊天机器人”，而是更多高频、低客单、对毛利敏感的 AI 应用：客服、销售外呼、内容流水线、代码审查、企业知识检索、行业 Copilot。

我没法确认百度这次是不是这个拐点的决定性事件，因为单一公司口径不够，且缺少第三方成本审计。但结构上已经越来越清楚：模型行业正在从“训练一个最强模型”转向“用可接受能力覆盖更多 token 消费场景”。

这也是 DeepSeek 今年最有杀伤力的地方，不只是模型表现，而是它迫使全行业重新讨论 cost-performance ratio。百度现在显然不想把这张牌只留给开源阵营或新锐公司。

换句话说，百度不是在追逐一场榜单竞争，它是在回应一个行业级 inflection point：能力溢价正在收缩，成本优势开始显性化。

04 对 AI builder 意味着什么

对 AI builder 来说，这周和这个月该调整的，不是“要不要马上接文心 5.1”，而是评估框架。

第一，把模型采购从“单模型崇拜”改成“routing 视角”。

如果供给侧越来越多人宣称自己能以更低成本达到接近能力，那么最合理的架构不是押注唯一模型，而是为不同任务做 model routing：高价值链路用最强模型，长尾任务、批处理、检索改写、结构化抽取用更便宜模型。那个真正会被定价的，是每个任务的 unit economics。

第二，重新审视中国区 API 与私有化部署的替代关系。

百度这种大厂如果把成本曲线压下来，企业客户会更愿意接受“公有云 API + 数据隔离 + 专属资源池”的混合方案，而不一定一步到位买重私有化。对创业公司来说，这会挤压单纯“帮客户本地部署一个通用模型”的毛利空间。我没直接看过百度当前成交结构，这点我可能判断得偏快，但趋势上成立概率不低。

第三，关注训练成本叙事是否最终传导到 token 价格。

这是最实际的一点。很多模型公司在发布时讲训练效率，最终 API 定价却未必跟着下调，因为它们要覆盖销售、算力储备、后训练、服务体系和生态补贴。作为 API 消费者，你不能只听“6% 训练成本”，要追问三件事：输入/输出 token 价格会不会降，batch API 是否有折扣，prompt caching 与长 context 是否同步优化。

第四，产品层机会反而在“以前算不过来”的场景。

如果成本继续下探，低 ARPU、高调用频次的工作流类产品会重新变得有吸引力。尤其是多步 Agent、长链路 reasoning、海量文档处理、搜索增强生成这类过去容易被推理成本拖垮的场景。opcx.ai 这类网关平台会直接受益于这种供给多元化，因为 routing、fallback、成本控制、跨模型切换的价值会越来越高。

第五，不要被“榜单第一”带偏。

LMArena 搜索榜是一个信号，但不是采购结论。真实决策还是要看你的 workload：代码、客服、中文写作、工具调用、RAG、长上下文、多轮稳定性，各项结果可能完全不同。我没亲自跑过文心 5.1 在这些任务上的系统对比，所以这里最稳妥的动作不是站队，而是立刻补一轮 benchmark matrix。

05 反方观点 / 风险

我前面的判断，有可能高估了这条新闻的结构性意义。

第一种可能，是“6% 成本”只是营销口径，而不是可复现的产业事实。

新闻没有说明对比对象是谁，也没有说明是按 FLOPs、总训练账单、单位 token 成本，还是某个特定规模区间比较。没有这些细节，外部其实无法严肃验证。也就是说，百度也许只是找到了一组对自己最有利的比较方式。

第二种可能，是训练成本已经没那么重要，真正贵的是后训练和服务化。

今天一个可商用模型的总成本，越来越多发生在 SFT、RL、数据清洗、安全对齐、评测、工具调用、推理集群和企业交付。即使预训练便宜了很多，如果后面的链条没同步优化，最终也未必能形成 API 价格优势。我没拿到文心 5.1 的全链路成本结构，这里必须保留怀疑。

第三种可能，是百度即便拿到了成本优势，也未必拿得到开发者心智。

这一直是中国大厂做模型时最容易被忽略的问题：技术、云、销售、资本开支都不缺，缺的是 developer love。模型 API 不是纯粹的性能游戏，也是文档质量、SDK 体验、社区示例、计费透明度、问题响应速度、协议兼容性的问题。没有这些，低成本会变成“可采购”，但不会变成默认选项。

第四种可能，是开源模型把这套叙事抢走。

如果接下来 Qwen、DeepSeek、Mistral 一类继续用 open weights 或更激进价格，把 cost-performance ratio 推得更低，那百度的优势会被重新压缩。闭源大厂一旦不能在能力或分发上形成明显溢价，单讲成本效率未必足够建立 moat。

所以我最后的结论并不是“文心 5.1 已经赢了”。

更准确地说，百度这次释放了一个不能忽视的信号：基础模型竞争已经进入成本曲线公开化阶段。谁能把这个信号兑现成便宜、稳定、可接入的 token 供给，谁才配谈下一轮格局。

文心 5.1 真正在卖成本曲线

01 触发事件

02 这事的真正含义

03 历史类比 / 结构对照

04 对 AI builder 意味着什么

05 反方观点 / 风险

Related Reading

Claude Keeps Cutting Out Mid-Draft? Anthropic Just Raised Limits

Google Lets Chrome Run AI Models Directly — The Browser is Becoming the New OS

Korean Temple Ordains Robot Monk — AI Spectacle Is the Real Bubble Risk

Local Small Models Ace Junior IT Ops: 30-Year Vet Predicts Human-Machine Shift

Gov AI Veto: How Solo Founders Prep

Anthropic's Code w/ Claude 2026 Signals AI Coding Shifts to Real-World Implementation