mmrag-strategy-bench

A lightweight benchmark to compare three multimodal RAG retrieval patterns on the same corpus.

Why this project

This repo distills ideas from small open-source multimodal RAG demos and turns them into a reproducible benchmark:

Strategy A (raw_multimodal): retrieve with text + table + image summary signals directly.
Strategy B (summary_first): convert all modalities into text-like summaries, then retrieve as pure text.
Strategy C (hybrid_rerank): summary-first coarse retrieval, then multimodal rerank.

This mirrors common industry choices when building practical multimodal RAG systems for PDFs/reports.

Highlights

Pure Python, no heavy model dependency.
Supports JSONL corpora with text/table/image_summary fields.
Built-in retrieval metrics: Recall@K and MRR.
CLI for search and evaluation.

Install

python -m venv .venv
source .venv/bin/activate
pip install -e .

Data format

Each line of corpus JSONL:

{
  "id": "doc-1",
  "source": "paper-A.pdf#p2",
  "text": "...",
  "table": "...",
  "image_summary": "...",
  "image_tags": ["chart", "accuracy"]
}

QA file (JSON list):

[
  {
    "question": "Which model gets the best OCR F1 in 2025 benchmark?",
    "gold_doc_ids": ["doc-2"]
  }
]

Quickstart

Run a search:

mmrag-bench search \
  --corpus data/sample_corpus.jsonl \
  --query "Which model has the best OCR F1?" \
  --strategy hybrid_rerank \
  --top-k 3

Run evaluation:

mmrag-bench eval \
  --corpus data/sample_corpus.jsonl \
  --qa data/sample_qa.json \
  --top-k 3

Example output

strategy=raw_multimodal recall@3=1.0000 mrr=1.0000
strategy=summary_first recall@3=1.0000 mrr=0.8333
strategy=hybrid_rerank recall@3=1.0000 mrr=1.0000

Repository layout

src/mmrag_strategy_bench/ core package
data/ sample corpus and sample QA set
tests/ sanity tests

Acknowledgement

Conceptually inspired by:

This implementation is original and intentionally lightweight for educational benchmarking.

License

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
data		data
src/mmrag_strategy_bench		src/mmrag_strategy_bench
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
pyproject.toml		pyproject.toml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

mmrag-strategy-bench

Why this project

Highlights

Install

Data format

Quickstart

Example output

Repository layout

Acknowledgement

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

mmrag-strategy-bench

Why this project

Highlights

Install

Data format

Quickstart

Example output

Repository layout

Acknowledgement

License

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages