RAG 检索增强生成是什么？一文讲清原理与流程

如果你用大模型问过一些具体、专业的问题，大概率遇到过它「一本正经地胡说八道」——术语叫幻觉（hallucination）。RAG 就是目前对付幻觉最主流的工程方案。这篇用最直白的方式讲清楚它是什么、怎么工作的。

为什么模型会「胡说」

大模型的知识来自训练数据，有两个天然局限：

当被问到这些范围外的问题时，模型不会说「我不知道」，而是倾向于根据语言概率编一个看起来合理的答案。这就是幻觉的根源。

RAG 全称 Retrieval-Augmented Generation（检索增强生成）。思路一句话概括：

回答之前，先去资料库里找相关内容，把找到的资料连同问题一起交给模型，让它「看着资料回答」。

相当于把闭卷考试变成了开卷考试——模型不用死记硬背，而是现查现答。

一个典型的 RAG 系统分两个阶段。

整个过程对用户是无感的，体验上就是「问一句、答一句」，但答案背后是有依据的。

它也有局限，用之前要清楚：

RAG 的本质，是给大模型外挂了一个「可随时查阅的资料库」，用检索来弥补模型知识的时效性和私有性短板。它不改变模型本身，却能大幅提升回答的准确度——这也是为什么今天几乎所有严肃的 AI 应用，背后都有 RAG 的影子。