ai 6 分钟 2026-04-25
RAG 项目为什么要先做 retrieval-only
RAG 系统的渐进式实现策略,从关键词检索到向量检索的演进。
RAG检索AI架构
## RAG 全称
Retrieval-Augmented Generation
## 为什么先做 retrieval-only
1. 不需要 LLM API key
2. 不需要向量数据库
3. 可以快速验证检索逻辑
4. 用户可以看到真实结果
## 渐进式实现
1. 阶段 1: 关键词检索
2. 阶段 2: TF-IDF 检索
3. 阶段 3: 向量检索 (pgvector)
4. 阶段 4: LLM 生成
## 经验
1. 先让检索工作
2. 再优化排序
3. 最后加生成