turbovec

找到 1 篇关于此标签的文章

1000 万文档向量可从 31GB 压到 4GB，RAG 成本开始回到工程优化

一项向量索引方案给出的数字很直接：1000 万文档可从 31GB 压到 4GB。我们注意到，这不是又一个“更强模型”，而是 RAG（检索增强生成，用外部知识补充大模型回答）开始进入算账阶段：谁能把检索成本做低，谁才更容易真正落地。