RAG 智能问答系统 (LangChain 版本)

基于 LangChain 框架的 RAG（检索增强生成）智能问答系统，通过向量检索 + LLM 生成，提供准确的问答服务。

✨ 特性

🔗 基于 LangChain - 使用 LangChain 生态系统构建
🧠 HuggingFace Embeddings - 支持多语言语义向量化
📚 FAISS 向量存储 - 高效的相似度检索
🎯 智能重排序 - 多策略文档重排序提升检索精度
💬 OpenAI LLM - 强大的语言生成能力
⚡ 流式输出 - 支持实时流式响应
⚙️ 配置管理 - 统一的配置文件和环境变量管理

快速开始

1. 安装依赖

pip install -r requirements.txt

2. 配置环境变量

创建 .env 文件：

OPENAI_API_KEY=your_api_key
OPENAI_API_BASE=https://api.openai.com/v1
OPENAI_MODEL=gpt-4o-mini
OPENAI_TEMPERATURE=1.0

3. 运行程序

python main.py

项目结构

QARag/
├── config/                  # 配置管理
│   ├── config.yaml         # 主配置文件
│   ├── config_manager.py   # 配置管理器
│   └── prompt_templates.py # Prompt 模板
├── src/                    # 核心代码
│   ├── data_loader.py     # 数据加载
│   ├── embedding.py       # LangChain Embeddings
│   ├── retriever.py       # LangChain FAISS VectorStore
│   ├── reranker.py        # 文档重排序
│   ├── llm_client.py      # LangChain ChatOpenAI
│   └── rag_pipeline.py    # RAG 主流程
├── tests/                 # 测试文件
│   └── test_all.py       # 整合测试
├── data/                  # 数据目录
│   └── raw/qa_pairs_rag.json
├── main.py               # 程序入口
└── requirements.txt      # 依赖列表

核心架构

LangChain 组件

组件	LangChain 类	说明
Embeddings	`HuggingFaceEmbeddings`	文本向量化
VectorStore	`FAISS`	向量存储和检索
Reranker	`Reranker`	文档重排序
LLM	`ChatOpenAI`	语言模型
Messages	`HumanMessage`, `SystemMessage`	消息封装

RAG 流程

用户问题
    ↓
[Embeddings] 问题向量化
    ↓
[FAISS VectorStore] 相似度检索（top_k=5）
    ↓
[Reranker] 智能重排序（可选）
    ↓
[过滤] 相似度阈值过滤
    ↓
[Prompt 构建] 整合上下文
    ↓
[ChatOpenAI] LLM 生成回答
    ↓
返回结果

使用示例

交互式问答

python main.py

# 可用命令：
# - 直接输入问题
# - help: 显示帮助
# - stats: 显示统计信息
# - exit: 退出

Python API

from src.rag_pipeline import RAGPipeline

# 初始化（使用配置文件默认值）
pipeline = RAGPipeline()
pipeline.initialize()

# 单个问题
result = pipeline.answer("如何申请退款？")
print(result['answer'])

# 流式输出
for chunk in pipeline.answer_stream("贷款额度如何提升？"):
    print(chunk, end="")

# 批量处理
questions = ["问题1", "问题2", "问题3"]
results = pipeline.batch_answer(questions)

重排序功能详解

什么是重排序？

重排序（Reranking）是在初次向量检索后，对候选文档进行二次精排的技术，可以显著提升检索精度。

工作流程：

向量检索获取 top_k=5 个候选文档（召回阶段）
重排序器对这 5 个文档重新评分和排序（精排阶段）
返回重排序后的 top_k=3 个最优文档

使用示例

from src.rag_pipeline import RAGPipeline

# 使用默认重排序配置（配置文件设置）
pipeline = RAGPipeline()
pipeline.initialize()

# 自定义重排序策略
pipeline = RAGPipeline(
    use_rerank=True,
    rerank_strategy="cross_encoder",  # 或 diversity, mmr, similarity
    rerank_top_k=3
)
pipeline.initialize()

# 禁用重排序
pipeline = RAGPipeline(use_rerank=False)

重排序策略对比

策略	算法	精度	速度	是否需要额外模型
similarity	保持原有相似度排序	⭐⭐	⚡⚡⚡	否
diversity	类别分散策略	⭐⭐⭐	⚡⚡⚡	否
mmr	最大边际相关性	⭐⭐⭐⭐	⚡⚡	否
cross_encoder	交叉编码器深度评分	⭐⭐⭐⭐⭐	⚡	是

Cross Encoder 模型安装

如果使用 cross_encoder 策略，需要安装额外依赖：

pip install sentence-transformers

系统会自动下载模型 cross-encoder/ms-marco-MiniLM-L-6-v2（约 80MB）。

性能优化建议

两阶段检索：初始检索设置较大的 top_k（如 5-10），重排序返回较小的 top_k（如 3）
策略选择：根据延迟要求选择策略（实时应用用 mmr，离线场景用 cross_encoder）
阈值过滤：重排序后仍应用相似度阈值过滤低质量结果

更多详情请参考： 重排序功能使用指南

测试

# 运行所有测试
pytest tests/test_all.py -v

# 运行特定测试类
pytest tests/test_all.py::TestRAGPipeline -v

# 测试覆盖率
pytest tests/test_all.py --cov=src --cov-report=html

配置说明

config/config.yaml

# 向量化配置
embedding:
  model_name: "sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2"

# 检索配置
retrieval:
  top_k: 5                    # 初始检索文档数量（重排序前）
  similarity_threshold: 0.7   # 相似度阈值
  # 重排序配置
  rerank:
    enabled: true            # 是否启用重排序
    strategy: "cross_encoder"  # 重排序策略（见下文）
    top_k: 3                 # 重排序后返回的文档数量

# LLM 配置
llm:
  model: "gpt-4o-mini"
  temperature: 1.0
  max_tokens: 1000

环境变量优先级高于配置文件。

重排序策略说明

系统支持以下四种重排序策略：

策略	说明	适用场景
similarity	基于相似度排序（默认）	简单快速，无需额外计算
diversity	基于多样性重排序	希望结果覆盖多个类别
mmr	最大边际相关性	平衡相关性和多样性
cross_encoder	交叉编码器重排序	最高精度，但需要额外模型

推荐配置：

高精度场景：使用 cross_encoder（需安装 sentence-transformers）
多样性场景：使用 mmr 或 diversity
快速响应：使用 similarity（无重排序开销）

LangChain 优势

相比原生实现

特性	原生实现	LangChain 实现
代码量	更多	更少（减少30%）
可维护性	需要手动管理	框架统一管理
扩展性	需要自己实现	丰富的生态系统
文档支持	自己编写	官方文档完善
社区支持	有限	活跃的社区

主要改进

统一接口 - 所有组件使用 LangChain 标准接口
自动向量化 - FAISS.from_documents 自动处理向量生成
消息封装 - 使用 HumanMessage/SystemMessage 规范化
流式支持 - 原生支持流式输出
易于扩展 - 可轻松切换不同的 Embeddings/LLM/VectorStore

性能

检索速度: < 100ms（521 条数据）
重排序延迟:
- similarity/diversity/mmr: < 10ms
- cross_encoder: 50-100ms
向量维度: 384 维
LLM 响应: 2-4 秒
相似度计算: 余弦相似度

开发

# 安装依赖
pip install -r requirements.txt

# 运行测试
pytest

# 修改配置
vi config/config.yaml

# 查看日志
tail -f logs/app.log

依赖说明

核心依赖

langchain - LangChain 核心框架
langchain-community - 社区组件（HuggingFace, FAISS）
langchain-openai - OpenAI 集成
langchain-core - 核心抽象
faiss-cpu - FAISS 向量检索

测试依赖

pytest - 测试框架
pytest-cov - 测试覆盖率

迁移指南

从原生实现迁移

如果你之前使用的是原生实现（sentence-transformers + 手动 FAISS），迁移到 LangChain 版本：

更新依赖
```
pip install -r requirements.txt
```

删除旧缓存

rm -rf data/processed/*.pkl
rm -rf vector_store/faiss_index/*.index

重新初始化
```
python main.py
```

LangChain 版本会自动重建索引，索引格式与原生版本不兼容。

文档资源

重排序功能使用指南 - 重排序策略详解、配置方法、最佳实践
CLAUDE.md - 项目架构、开发规范、LangChain集成说明

License

MIT License

贡献

欢迎提交 Issue 和 Pull Request！

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
.idea		.idea
config		config
data/raw		data/raw
doc		doc
src		src
tests		tests
.env		.env
.gitignore		.gitignore
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt

1041206149/QARag

Folders and files

Latest commit

History

Repository files navigation

RAG 智能问答系统 (LangChain 版本)

✨ 特性

快速开始

1. 安装依赖

2. 配置环境变量

3. 运行程序

项目结构

核心架构

LangChain 组件

RAG 流程

使用示例

交互式问答

Python API

重排序功能详解

什么是重排序？

使用示例

重排序策略对比

Cross Encoder 模型安装

性能优化建议

测试

配置说明

config/config.yaml

重排序策略说明

LangChain 优势

相比原生实现

主要改进

性能

开发

依赖说明

核心依赖

测试依赖

迁移指南

从原生实现迁移

文档资源

License

贡献

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages