xRAG

Official repo for xRAG: Extreme Context Compression for Retrieval-augmented Generation with One Token

Get Started

Refer to Dockerfile for required packages

Configure wandb and accelerate

wandb login
accelerate config

Pretrained Checkpoints

HuggingFace

Model	Backbone	Download
xRAG-7b	mistralai/Mistral-7B-Instruct-v0.2	🤗 Hugging Face
xRAG-MoE	mistralai/Mixtral-8x7B-Instruct-v0.1	🤗 Hugging Face

Tutorial

We provide a tutorial for xRAG in tutorial.ipynb. Check it out!

Data

download enwiki-dec2021 as pretraining data and corpus for retrieval
prepare instruction tuning data in prepare_data.ipynb
download TriviaQA
using ColBERT-v2 to conduct retrieval

Training

Training scripts in scripts/, for example, to train a Mistral-7b with SFR:

accelerate launch \
    --mixed_precision bf16 \
    --num_machines 1 \
    --num_processes 8 \
    --main_process_port 29666 \
    -m \
    src.language_modeling.train \
    --config config/language_modeling/pretrain.yaml \

Evaluation

The evaluation code is in src/eval. For example, to evaluate on TriviaQA:

without retrieval augmentation:

CUDA_VISIBLE_DEVICES=0 python -m src.eval.run_eval \
        --data triviaqa \
        --model_name_or_path Hannibal046/xrag-7b

with retrieval augmentation:

CUDA_VISIBLE_DEVICES=0 python -m src.eval.run_eval \
        --data triviaqa \
        --model_name_or_path Hannibal046/xrag-7b \
        --use_rag

with xRAG:

CUDA_VISIBLE_DEVICES=0 python -m src.eval.run_eval \
        --data triviaqa \
        --model_name_or_path Hannibal046/xrag-7b \
        --retriever_name_or_path Salesforce/SFR-Embedding-Mistral \
        --use_rag

Benchmark

To benchmark xRAG, we provide the code in src/language_modeling/profiler.py.

python -m src.language_modeling.profiler --instruction_length 54 --generation_length 30 --dataset triviaqa --use_xrag
python -m src.language_modeling.profiler --instruction_length 54 --generation_length 30 --dataset triviaqa

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
assets		assets
config		config
data		data
scripts/language_modeling		scripts/language_modeling
src		src
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
prepare_data.ipynb		prepare_data.ipynb
tutorial.ipynb		tutorial.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

xRAG

Get Started

Pretrained Checkpoints

Tutorial

Data

Training

Evaluation

Benchmark

About

Releases

Packages

Languages

Hannibal046/xRAG

Folders and files

Latest commit

History

Repository files navigation

xRAG

Get Started

Pretrained Checkpoints

Tutorial

Data

Training

Evaluation

Benchmark

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages