AI 问通笔记

RAG 入门:先理解检索,再谈生成

RAG 的关键不是把资料交给模型,而是用检索把正确上下文送到模型面前。

2026年6月30日1 分钟阅读AI 问通
RAG 入门:先理解检索,再谈生成

RAG 的核心动作

RAG 可以拆成三步:把资料切成片段,按照问题检索相关片段,把片段和问题一起交给模型生成回答。每一步都影响最终质量。

检索失败比生成失败更常见

如果检索拿到的是错误片段,模型再强也只能基于错误上下文回答。排查 RAG 问题时,先看召回结果,再看模型输出。

元数据很重要

资料来源、日期、主题、作者、适用版本都应该进入元数据。这样检索可以按条件过滤,回答也能给出更可信的引用。

小规模先跑通

不要一开始就导入几万篇资料。先用 20 到 50 篇高质量文档跑通流程,看召回是否稳定,再扩大规模。