返回首页

RAG

找到 21 篇关于此标签的文章

RAGASRAG

RAG 系统不能靠感觉打分 — AI 应用开始进入精细化运营时代

RAGAS 框架用 4 个量化指标给 RAG(检索增强生成)系统打分,解决“感觉不错但说不清好在哪里”的痛点。这标志着企业 AI 应用从“能跑就行”转向数据驱动的精细化运营。

May 61 分钟
Transformer自注意力机制

自注意力机制让AI看懂上下文 — 但理解它的企业仍然不多

自注意力机制是当前主流AI模型的核心,让AI能同时考虑一段话里所有词的关系。理解它,是判断AI应用成本与效果的关键起点,值得每位关注AI的决策者花十分钟搞懂。

May 61 分钟
RAGASRAG

RAG 系统质量不能再靠感觉判断 — RAGAS 框架用 AI 给 AI 当考官

RAG 系统上线后多数团队靠人工抽查判断质量,问题隐而不发。RAGAS 框架用四个可量化维度评估 RAG,核心思路是用 LLM 评估 LLM,让质量从感觉变成工程指标,值得所有部署知识库的企业关注。

May 61 分钟
LangChainRAG

RAG 五阶段拆解 — 大模型走向开卷考试,企业落地标配已定

RAG 架构正成为企业应用大模型的标配方案,它通过检索外部知识让大模型“开卷考试”。但检索准确率和工程化难度仍是落地隐患,数据清洗成为新瓶颈。

May 51 分钟
RAG向量数据库

大模型总爱瞎编:RAG 让 AI 先查资料再回答,这正成为企业落地标配

RAG(检索增强生成)让大模型回答前先查外部资料,解决知识滞后和幻觉问题。这不是技术补丁,而是企业让 AI 真正接触私域数据、避免乱说话的关键基础设施。

May 51 分钟
RAG向量数据库

AI 查不准资料是通病 — 光靠向量数据库的 RAG 已经不够用了

企业部署 RAG(检索增强生成,让大模型先查资料再回答)常遇答非所问。问题出在“怎么找资料”:基础的相似度检索会导致结果重复或无视条件。检索策略的升级,才是决定企业知识库能不能用的真正分水岭。

May 51 分钟
DeepTutorHKUDS

港大开源 DeepTutor 支持本地部署 — AI 辅导工具安装门槛又降一档

港大数据科学实验室开源 DeepTutor,提供向导式安装和本地向量服务,AI 辅导工具部署门槛显著降低。值得关心:教育类 AI 应用正从云端订阅走向本地可控,但硬件和配置要求仍将多数非技术用户挡在门外。

May 51 分钟
VectaRAG

实测九十万Token的RAG切分:最笨的按行切法最准,企业知识库别交智商税

RAG(检索增强生成)是大企业让AI读内部文档的主流方案,但多数项目效果差,根子出在文档切分上。最新实测表明,最简单的按标点切分准确率反而最高。企业建知识库,切分策略比选大模型更决定成败。

May 41 分钟
RAG向量检索

企业 AI 知识库总答非所问,90% 的败因在检索层而非大模型

企业 AI 知识库总翻车,多数人以为是模型不行,但我们注意到真正的瓶颈在检索层。向量相似度不等于业务相关性,优化检索策略才是让 AI 落地的解药。

May 41 分钟
LangChainAgent

LangChain 拆解 AI 开发为四大组件 — 它不是代码框架而是编排层

LangChain 将 AI 开发拆解为 Chain、Agent、Memory、Tool 四大组件。它不是普通代码框架,而是给大模型配齐手脚的编排层,将 AI 从“说话”转向“干活”,这值得所有关注 AI 落地的人关心。

May 41 分钟
QdrantPinecone

传统数据库存不了 AI 的「语义」— 向量数据库选型正决定企业知识库成败

企业想让 AI 读懂内部文档,传统数据库只能做精确查询而无法处理语义相似性。向量数据库作为 RAG 的底层基建,其选型直接决定了企业知识库的检索效率和长期扩展性。

May 41 分钟
RAGCRAG

RAG架构从1种裂变为9种 — 生产级AI系统正告别“差不多就行”

一份实战指南梳理出 9 种 RAG 架构,这标志着企业 AI 落地正从“能回答”向“不出错”硬扛。选错架构不仅浪费数月,更会让机器人自信地胡说八道。

May 31 分钟
BGEOpenAI

换 Embedding 模型后 RAG 检索效果差 40% — 语义引擎才是胜负手

Embedding 是 RAG 的语义引擎,决定了检索能否理解同义词和上下文。中文场景下 BGE 等开源模型已反超 OpenAI,选对模型比调参更重要 — 但榜单排名不等于业务效果,过度优化单一环节是常见投入错配。

May 31 分钟
ArchonRAG

AI 编码工具 Archon 爆火 — 放弃让 AI 自由发挥,确定性编排才是工程化终局

开源项目 Archon 放弃让 AI 自由发挥,转用确定性工作流约束 AI。这种“代码干脏活、AI 动脑子”的混合编排架构,正在成为企业 AI 落地摆脱黑盒失控的唯一解法。

May 31 分钟
LangChainAgent

LangChain 教 AI 记笔记 — 记忆管理正成为 Agent 落地的生死线

大模型天生'健忘',每次对话都不记得上一轮。LangChain 推出两层记忆方案解决 Agent 的失忆问题,这决定了 AI 应用能否从玩具变成工具。

May 31 分钟
RAGLangChain

文档分块决定AI回答质量 — 这步做不好,再强的模型也白搭

RAG(让AI先查资料再回答的技术)效果好坏,60%取决于文档怎么切。四种分块策略从粗暴到精细,成本与效果对等。企业落地时,这里往往是最大瓶颈。

May 21 分钟
大模型Agent

拆解大模型血缘图谱:从LLM到Agent,核心都是在给上下文打补丁

技术圈天天造词,从RAG到MCP让人眼花。本文梳理了大模型核心概念的演进逻辑:LLM只会文字接龙,后续所有技术都是在给它补课。看懂这条线,就不会被新名词忽悠。

May 21 分钟
LangChainRAG

LangChain 搭建 RAG 只需 30 行代码 — AI 落地卡在管线而非模型

用 LangChain 搭建 RAG 核心代码只需约 30 行,企业 AI 落地卡点从来不是模型本身,而是连接各组件的“水管”脏活。框架降低了试错成本,但也掩盖了底层细节。

Apr 301 分钟
MilvusVolcengine

火 山引擎发布 Milvus Serverless:实例创建仅需 3 秒

字节跳动旗下火山引擎推出 Milvus Serverless,实例创建仅需约 3 秒,支持按需计费与缩容至零,专 为 AI Agent 与 RAG 应用场景设计。

Apr 131 分钟
DeepSeekRAG

RAG 架构迁移:从自建 GPU 集群转向 API, 成本直降 97%

一 家中国 SaaS 企业将 AI 基础设施从四块 A100 迁移至 De epSeek API,月度成本从 8 万元骤降至不足 2000 元,降幅达 97.5%。

Apr 131 分钟
LangChainChroma

LangChain-Chroma 高并发架构:超越基础 RAG

详解如何解决 Chroma 从原型扩展到生产环境时的写入阻塞、查询延迟激增及 OOM 错误,提供四种具体优化方案。

Apr 71 分钟