这是论文 "Uni-GR: Unifying Generative Retrieval and Answer Generation via Hierarchical Contrastive Alignment" 的代码实现原型。
本项目旨在通过单一 Transformer 模型实现端到端的检索与问答,消除传统 RAG 系统的索引瓶颈。核心特性包括:
- 分层语义索引:利用递归 K-Means 将文档映射为结构化的语义路径 ID。
- 对比校准损失:在生成过程中强制对齐查询与文档的潜在空间,显著减少幻觉。
快速开始:
- 安装依赖:
pip install -r requirements.txt - 构建索引:
python src/indexer.py - 训练模型:
python train.py - 推理测试:
python inference.py