RAG

找到 21 篇关于此标签的文章

RAGASRAG

RAG 系统不能靠感觉打分 — AI 应用开始进入精细化运营时代

RAGAS 框架用 4 个量化指标给 RAG（检索增强生成）系统打分，解决“感觉不错但说不清好在哪里”的痛点。这标志着企业 AI 应用从“能跑就行”转向数据驱动的精细化运营。

May 61 分钟

Transformer自注意力机制

自注意力机制让AI看懂上下文 — 但理解它的企业仍然不多

自注意力机制是当前主流AI模型的核心，让AI能同时考虑一段话里所有词的关系。理解它，是判断AI应用成本与效果的关键起点，值得每位关注AI的决策者花十分钟搞懂。

May 61 分钟

RAGASRAG

RAG 系统质量不能再靠感觉判断 — RAGAS 框架用 AI 给 AI 当考官

RAG 系统上线后多数团队靠人工抽查判断质量，问题隐而不发。RAGAS 框架用四个可量化维度评估 RAG，核心思路是用 LLM 评估 LLM，让质量从感觉变成工程指标，值得所有部署知识库的企业关注。

May 61 分钟

LangChainRAG

RAG 五阶段拆解 — 大模型走向开卷考试，企业落地标配已定

RAG 架构正成为企业应用大模型的标配方案，它通过检索外部知识让大模型“开卷考试”。但检索准确率和工程化难度仍是落地隐患，数据清洗成为新瓶颈。

May 51 分钟

RAG向量数据库

大模型总爱瞎编：RAG 让 AI 先查资料再回答，这正成为企业落地标配

RAG（检索增强生成）让大模型回答前先查外部资料，解决知识滞后和幻觉问题。这不是技术补丁，而是企业让 AI 真正接触私域数据、避免乱说话的关键基础设施。

May 51 分钟

RAG向量数据库

AI 查不准资料是通病 — 光靠向量数据库的 RAG 已经不够用了

企业部署 RAG（检索增强生成，让大模型先查资料再回答）常遇答非所问。问题出在“怎么找资料”：基础的相似度检索会导致结果重复或无视条件。检索策略的升级，才是决定企业知识库能不能用的真正分水岭。

May 51 分钟

DeepTutorHKUDS

港大开源 DeepTutor 支持本地部署 — AI 辅导工具安装门槛又降一档

港大数据科学实验室开源 DeepTutor，提供向导式安装和本地向量服务，AI 辅导工具部署门槛显著降低。值得关心：教育类 AI 应用正从云端订阅走向本地可控，但硬件和配置要求仍将多数非技术用户挡在门外。

May 51 分钟

VectaRAG

实测九十万Token的RAG切分：最笨的按行切法最准，企业知识库别交智商税

RAG（检索增强生成）是大企业让AI读内部文档的主流方案，但多数项目效果差，根子出在文档切分上。最新实测表明，最简单的按标点切分准确率反而最高。企业建知识库，切分策略比选大模型更决定成败。

May 41 分钟

RAG向量检索

企业 AI 知识库总答非所问，90% 的败因在检索层而非大模型

企业 AI 知识库总翻车，多数人以为是模型不行，但我们注意到真正的瓶颈在检索层。向量相似度不等于业务相关性，优化检索策略才是让 AI 落地的解药。

May 41 分钟

LangChainAgent

LangChain 拆解 AI 开发为四大组件 — 它不是代码框架而是编排层

LangChain 将 AI 开发拆解为 Chain、Agent、Memory、Tool 四大组件。它不是普通代码框架，而是给大模型配齐手脚的编排层，将 AI 从“说话”转向“干活”，这值得所有关注 AI 落地的人关心。

May 41 分钟

QdrantPinecone

传统数据库存不了 AI 的「语义」— 向量数据库选型正决定企业知识库成败

企业想让 AI 读懂内部文档，传统数据库只能做精确查询而无法处理语义相似性。向量数据库作为 RAG 的底层基建，其选型直接决定了企业知识库的检索效率和长期扩展性。

May 41 分钟

RAGCRAG

RAG架构从1种裂变为9种 — 生产级AI系统正告别“差不多就行”

一份实战指南梳理出 9 种 RAG 架构，这标志着企业 AI 落地正从“能回答”向“不出错”硬扛。选错架构不仅浪费数月，更会让机器人自信地胡说八道。

May 31 分钟

BGEOpenAI

换 Embedding 模型后 RAG 检索效果差 40% — 语义引擎才是胜负手

Embedding 是 RAG 的语义引擎，决定了检索能否理解同义词和上下文。中文场景下 BGE 等开源模型已反超 OpenAI，选对模型比调参更重要 — 但榜单排名不等于业务效果，过度优化单一环节是常见投入错配。

May 31 分钟

ArchonRAG

AI 编码工具 Archon 爆火 — 放弃让 AI 自由发挥，确定性编排才是工程化终局

开源项目 Archon 放弃让 AI 自由发挥，转用确定性工作流约束 AI。这种“代码干脏活、AI 动脑子”的混合编排架构，正在成为企业 AI 落地摆脱黑盒失控的唯一解法。

May 31 分钟

LangChainAgent

LangChain 教 AI 记笔记 — 记忆管理正成为 Agent 落地的生死线

大模型天生'健忘'，每次对话都不记得上一轮。LangChain 推出两层记忆方案解决 Agent 的失忆问题，这决定了 AI 应用能否从玩具变成工具。

May 31 分钟

RAGLangChain

文档分块决定AI回答质量 — 这步做不好，再强的模型也白搭

RAG（让AI先查资料再回答的技术）效果好坏，60%取决于文档怎么切。四种分块策略从粗暴到精细，成本与效果对等。企业落地时，这里往往是最大瓶颈。

May 21 分钟

大模型Agent

拆解大模型血缘图谱：从LLM到Agent，核心都是在给上下文打补丁

技术圈天天造词，从RAG到MCP让人眼花。本文梳理了大模型核心概念的演进逻辑：LLM只会文字接龙，后续所有技术都是在给它补课。看懂这条线，就不会被新名词忽悠。

May 21 分钟

LangChainRAG

LangChain 搭建 RAG 只需 30 行代码 — AI 落地卡在管线而非模型

用 LangChain 搭建 RAG 核心代码只需约 30 行，企业 AI 落地卡点从来不是模型本身，而是连接各组件的“水管”脏活。框架降低了试错成本，但也掩盖了底层细节。

Apr 301 分钟

MilvusVolcengine

火山引擎发布 Milvus Serverless：实例创建仅需 3 秒

字节跳动旗下火山引擎推出 Milvus Serverless，实例创建仅需约 3 秒，支持按需计费与缩容至零，专为 AI Agent 与 RAG 应用场景设计。

Apr 131 分钟

DeepSeekRAG

RAG 架构迁移：从自建 GPU 集群转向 API，成本直降 97%

一家中国 SaaS 企业将 AI 基础设施从四块 A100 迁移至 De epSeek API，月度成本从 8 万元骤降至不足 2000 元，降幅达 97.5%。

Apr 131 分钟

LangChainChroma

LangChain-Chroma 高并发架构：超越基础 RAG

详解如何解决 Chroma 从原型扩展到生产环境时的写入阻塞、查询延迟激增及 OOM 错误，提供四种具体优化方案。

Apr 71 分钟

RAG

RAG 系统不能靠感觉打分 — AI 应用开始进入精细化运营时代

自注意力机制让AI看懂上下文 — 但理解它的企业仍然不多

RAG 系统质量不能再靠感觉判断 — RAGAS 框架用 AI 给 AI 当考官

RAG 五阶段拆解 — 大模型走向开卷考试，企业落地标配已定

大模型总爱瞎编：RAG 让 AI 先查资料再回答，这正成为企业落地标配

AI 查不准资料是通病 — 光靠向量数据库的 RAG 已经不够用了

港大开源 DeepTutor 支持本地部署 — AI 辅导工具安装门槛又降一档

实测九十万Token的RAG切分：最笨的按行切法最准，企业知识库别交智商税

企业 AI 知识库总答非所问，90% 的败因在检索层而非大模型

LangChain 拆解 AI 开发为四大组件 — 它不是代码框架而是编排层

传统数据库存不了 AI 的「语义」— 向量数据库选型正决定企业知识库成败

RAG架构从1种裂变为9种 — 生产级AI系统正告别“差不多就行”

换 Embedding 模型后 RAG 检索效果差 40% — 语义引擎才是胜负手

AI 编码工具 Archon 爆火 — 放弃让 AI 自由发挥，确定性编排才是工程化终局

LangChain 教 AI 记笔记 — 记忆管理正成为 Agent 落地的生死线

文档分块决定AI回答质量 — 这步做不好，再强的模型也白搭

拆解大模型血缘图谱：从LLM到Agent，核心都是在给上下文打补丁

LangChain 搭建 RAG 只需 30 行代码 — AI 落地卡在管线而非模型

火 山引擎发布 Milvus Serverless：实例创建仅需 3 秒

RAG 架构迁移：从自建 GPU 集群转向 API， 成本直降 97%

LangChain-Chroma 高并发架构：超越基础 RAG

火山引擎发布 Milvus Serverless：实例创建仅需 3 秒

RAG 架构迁移：从自建 GPU 集群转向 API，成本直降 97%