Lobsters 社区一篇题为《It doesn’t matter if it works》的讨论热度走高,核心判断很直接:对不少 AI 产品来说,一次演示能成功,已经不足以证明它有商业价值。我们注意到,这种声音之所以重要,不是因为它反 AI,而是因为行业正在告别“跑通一个 demo(演示版本)就算成立”的阶段。

这是什么

这篇文章和评论区讨论的,不是某个新模型参数,也不是某家公司融资,而是一个更底层的问题:如果一项 AI 功能即使能工作,但成本高、结果不稳定、流程难接入,它对用户仍然可能“等于不能用”

过去两年,市场常用“成功案例”判断 AI 进展:写出一篇文案、做完一次客服回复、自动生成一段代码。但现在,企业更关心的是另一组指标:失败率有多高、人工复核要多少、接入现有系统麻不麻烦、出了错谁负责。换句话说,AI 的评估标准,正从“能力展示”转向“可持续交付”。

这也是为什么不少人开始少谈 Agent(可自主调用工具、执行多步任务的 AI 代理)能做多少事,多谈落地后的维护成本。模型会做,不代表公司该用;用户觉得新鲜,也不代表产品留得住。

行业怎么看

支持这一判断的人认为,AI 行业正在经历一次正常回调。早期大家看重“第一次成功”,因为那代表技术边界被推开;但进入部署阶段后,真正决定采购和续费的,是稳定性、责任边界和总成本。尤其在企业软件里,80 分的偶尔惊艳,往往不如 95 分的稳定可控。

值得我们关心的是,反对意见也很明确。第一种声音认为,今天拿“稳定交付”要求生成式 AI,可能过早,因为模型能力仍在快速上升,很多今天不可靠的任务,半年后可能就够用了。第二种风险是,市场可能因此过度保守,把 AI 仅当作辅助工具,错过更激进的流程改造机会。还有一种更现实的担忧:如果企业把“先别用,等成熟”当成默认态度,也可能在内部错失数据积累和工作流重构的窗口期。

我们的判断是,这篇讨论的价值不在于唱空 AI,而在于把问题从“它灵不灵”推进到“它值不值”。这是一个更接近预算、组织和责任分配的问题,也因此更接近真实商业世界。

对普通人的影响

对企业 IT:采购重点会继续从模型榜单,转向集成能力、审计记录和容错设计。以后买的未必是“最聪明”的 AI,而是最容易接进现有流程、出问题最容易兜底的那一个。

对个人职场:会用 AI 生成内容,正在变成基础能力;但更稀缺的,是判断哪些结果能直接用、哪些必须复核。会“管住 AI”,比单纯“会用 AI”更值钱。

对消费市场:面向个人的 AI 产品会更强调省时间,而不是秀能力。用户的新鲜感在下降,愿不愿持续付费,取决于它是不是稳定地替我们省下真实步骤,而不是偶尔带来惊喜。