“RAG 为什么不能省”“纯向量检索为什么不够”“Milvus、FAISS、Qdrant 怎么选”——一篇面向面试的技术帖把这些问题集中列出来,本身就说明判断已经很清楚:企业对大模型的需求,正在从“会不会生成”转向“能不能接上真实业务知识”。我们注意到,这不是技术圈自嗨,而是 AI 落地阶段最现实的一道门槛。
这是什么
RAG(检索增强生成,先从外部知识库找资料,再让大模型据此回答)本质上是在给大模型补课。因为单靠模型自身训练数据,往往有三个短板:不知道最新信息、碰不到企业私有数据、容易把不确定的内容说得像真的。
这篇文章虽然包装成“面试题汇总”,但真正重要的是它把一条企业知识接入链路说清了:文档处理、切分、向量化、检索、重排、生成。所谓重排(Rerank,先粗找一批结果,再二次排序)和混合检索(语义检索加关键词检索)这些环节,反映的不是炫技,而是一个事实:要让 AI 回答靠谱,难点越来越不在模型本身,而在知识工程。
行业怎么看
行业里对 RAG 的共识已经比较稳定:它不是替代大模型,而是给大模型加“外脑”。尤其在金融、制造、医药、政企这类知识密集行业,企业宁愿要一个回答没那么华丽、但能引用内部制度和最新资料的系统。
值得我们关心的是,RAG 的竞争也在迅速细化。过去大家讨论“接不接知识库”,现在讨论的是检索召回率、时延、表格解析、专业术语命中率,以及向量库选型。这意味着 AI 项目开始从演示阶段走向运营阶段。
但反对意见同样存在。第一,RAG 不是万灵药:如果文档质量差、更新不及时,系统只会更自信地输出旧答案。第二,链路越长,维护成本越高,企业需要持续处理权限、数据清洗和版本管理。第三,很多公司高估了“接个知识库就能落地”的速度,低估了内部知识本身并不结构化的现实。
对普通人的影响
对企业 IT: 采购重点会从“买一个大模型接口”转向“怎么把文档、流程和权限体系接进去”。真正花时间和预算的,往往是知识库治理,而不是模型调用本身。
对个人职场: 会提问已经不够,能把业务资料整理成可被机器调用的知识资产,会变成更值钱的能力。产品、运营、咨询、法务这类岗位,都会更常接触这类工具。
对消费市场: 以后用户看到的 AI 产品,会少一些“无所不知”的宣传,多一些“基于你的资料回答”的功能。短期体验未必更惊艳,但长期更容易形成付费意愿,因为它更接近可用而不是好玩。