01 触发事件

2025 年 9 月,The Verge 报道 Midjourney CEO David Holz 展示了公司首个硬件产品 The Midjourney Scanner:一台基于 ultrasound 的全身扫描设备,用一圈传感器获取身体内部的垂直切片,目标先看 muscle、fat、bone 和 organs 的组成。Holz 还说,它理想情况下可以一年做一次,甚至每天都做一次,并声称其图像质量“在很多方面可比 MRI”。同时,Midjourney 还计划在旧金山建一个 spa。

这件事表面上像是“做 AI 图片的公司突然去做医疗硬件”。

但真正值得看的是,Midjourney 在试图把自己从一个 image generation 工具,变成一个现实世界 measurement interface。

我没在内部看过这台 scanner 的原型,也没跑过它的成像质量验证,所以对 “comparable to MRI” 这句话,最多只能把它当作战略信号,而不是技术结论。

Aims for image quality comparable to MRI in many ways

如果这句话最后站不住,产品可能只是昂贵的 wellness gadget;如果它哪怕只成立一半,Midjourney 的边界就已经不是“文生图公司”了。

02 这事的真正含义

这才是 Midjourney 在说的事:生成式 AI 的下一层竞争,不只是生成能力,而是谁能控制高频、专有、结构化的现实世界数据流。

做“cat images”的公司很多。

但做“每天都可能产生一个人的身体内部 longitudinal dataset”的公司很少。

问题不在于 Midjourney 为什么跨界医疗,而在于图像模型公司为什么一定会寻找新的上游输入源。文生图市场的结构性问题很清楚:生成质量会趋同,模型能力会扩散,开源与闭源差距会阶段性缩小,真正难建立 moat 的不是模型本身,而是 distribution、workflow embedding、以及别人拿不到的数据。

Midjourney 原来的优势来自审美品味、社区和产品体验。

那是强优势,但不一定是不可替代优势。

尤其当图像生成越来越 commodity 化,用户 switching cost 其实没有表面看起来高。很多创作者会因为一个新模型的风格、价格、速度,立刻迁移部分工作流。对 API 用户更是如此,routing 一开,忠诚度就变成了 latency、price 和 output consistency 的函数。

所以 Midjourney 往医疗扫描走,逻辑并不奇怪。它不是在找一个更大的 TAM 神话,而是在找一个更硬的数据护城河

  • scanner 是数据入口
  • spa 是线下 distribution
  • 高频复扫是 retention 机制
  • 身体成像的时间序列是 proprietary corpus
  • 后续分析、报告、监测、个性化建议才是 software layer

这和“卖一次设备”不是一回事。

这是在尝试拥有一条闭环:采集、标注、解释、复购。

我可能低估了医疗合规和临床验证对节奏的拖慢。尤其 ultrasound 全身扫描要进入真正医疗决策,而不是 wellness 展示,监管、误报、漏报责任都会突然放大。但即便最后先落在 wellness 而非诊断,战略方向仍然成立:谁掌握采集端,谁就可能重写下游软件价值分配。

03 历史类比 / 结构对照

更像的历史类比,不是某家 AI 公司“副业太多”,而是 Apple 从 iPod 到 iPhone,以及 AWS 从内部基础设施变成外部平台 的两种结构叠加。

先看 Apple。

iPod 卖的是 device,但真正重要的是 iTunes 把内容分发、账户体系和硬件锁在一起。iPhone 更进一步,不只是一个更好的手机,而是一个新的计算入口。入口一旦改变,下游价值链全部重排。

Midjourney 如果只做图像生成,像是卖“更好看的 output”。

如果它做身体扫描,它是在争一个新的 input layer。

input layer 比 output layer 更值钱,因为它更稀缺,也更不容易被复制。模型能力会扩散,但现实世界高质量数据采集网络不会自动扩散。

再看 AWS。

Amazon 最初不是为了卖云才建基础设施,而是因为内部业务逼着它把计算、存储、部署能力标准化。标准化之后,这套能力反过来变成外部服务,成为新的利润引擎。

Midjourney 眼下也可能处在类似转折点:原本做 image model 的能力,开始被重新包装成某种 measurement-and-interpretation stack。scanner 只是 front-end,后面真正可能值钱的,是 reconstruction、segmentation、report generation、longitudinal comparison、以及最后的 recommendation engine。

我没法确认 Midjourney 是否真有能力把 medical imaging software stack 吃透,这里面和做 diffusion image generator 不是同一条技术链。medical imaging 涉及信号采集、重建算法、噪声处理、数据校准、临床标签、误差边界定义,这些都不是“模型很强”就能跨过去的。

但结构上,这像一个典型的 strategic inflection point:当原有产品的差异化开始收窄,公司就会往更上游、也更重的层走,哪怕那看起来离原业务很远。

04 对 AI builder 意味着什么

对 AI builder 来说,这条新闻最有价值的地方,不是“要不要做医疗”,而是三条更普遍的行动信号。

第一,单纯做 model wrapper 的窗口在继续收窄,做数据入口的价值在上升。

如果你的产品只是在调用现成模型生成文本、图像、代码,你卖的东西很容易被重新定价。真正能稳住毛利的,是你控制了别人拿不到、或者拿起来极麻烦的数据流。这个数据流不一定是医疗扫描,也可以是企业内部流程事件、设备传感器、客服对话、供应链单据、研发过程日志。

那个真正会被定价的,不是“AI 帮你分析”,而是“AI 为什么只有你能分析得这么准”。

第二,硬件 + software 的组合会重新变得重要。

过去几年很多 AI 创业者默认“纯软件更轻更快更 scalable”。这通常没错。

但当模型层越来越通用,轻不一定占优。重,反而可能建立 moat。一个传感器、一套采集流程、一个线下服务点,甚至一个人工标注环节,都可能让你拿到 API 对手拿不到的输入。

这不是说每家公司都该去做 device。

而是说,你要重新审视 workflow 的最前端:用户输入是怎么来的?有没有机会把“用户手动输入 prompt”替换成“系统自动采集事实”?

第三,应用层的竞争单位正在从“单次生成”变成“持续监测”。

这点很关键。

单次生成更像搜索替代,用户来了、生成了、走了。

持续监测才像 subscription business。它意味着更稳定的 usage,更高的 retention,更强的 switching cost,也意味着 token 经济学从 bursty 变成 predictable。对 API 平台、model gateway、routing system 来说,后者更容易优化 caching、batch、异步分析和成本曲线。

我可能在这里高估了普通消费者对“高频扫描自己身体”的接受度。人们愿意每天看步数,不代表愿意每天看器官切片。很多应用最后可能卡在行为习惯,而不是模型能力。

但对 B2B builder,这个方向已经足够明确:找高频数据回路,别只找高质量 prompt。

05 反方观点 / 风险

我前面的判断,核心前提是:Midjourney Scanner 最终能形成一个可持续的数据采集网络。

这件事完全可能不成立。

第一种可能,技术宣传远超实际能力

“很多方面可比 MRI” 这句话极其激进。MRI 和 ultrasound 的物理原理、分辨率特征、适用场景都不同。即便 AI reconstruction 能显著改善可视化,距离真正临床可替代通常也有很长距离。我没做过该设备的 blind evaluation,也没见到 peer-reviewed 数据,所以不能把它当成已验证事实。

第二种可能,医疗不是 software distribution 问题,而是信任和责任问题

在 image generation 里,输出好不好看,错了最多重来。

在身体扫描里,false positive 会制造焦虑,false negative 会制造风险。前者让用户不敢信,后者让监管不会放过。很多 AI 公司低估的,不是模型做不出来,而是服务交付链条里的 liability 根本不是互联网公司的舒适区。

第三种可能,spa 这个 distribution 也许太窄。

线下入口当然有价值,但它天然慢、重、资本开支高,而且地域扩张复杂。一个旧金山 spa 可以是 PR,也可以是 pilot,但距离全国乃至全球网络,中间隔着运营、地产、设备维护、专业人员、保险和合规。我可能误判了 Midjourney 对线下运营的耐心。

第四种可能,这只是创始人驱动的探索,不代表可复制商业模式。

很多强创始人会做看起来疯狂但不完全可证伪的项目,其中一部分最后改变行业,另一部分只是昂贵的 side quest。外部观察者容易把 vision 误读成 inevitability。

所以我不认为这件事已经证明 Midjourney 找到了第二增长曲线。

我认为它证明的是另一件更重要的事:领先的生成式 AI 公司已经在默认一个判断——模型本身不够,必须去抢真实世界的入口。

这才是需要被认真对待的信号。