Shared Task on ir-benchmarks

This repository exemplifies how archived shared task repositories of the IR Experiment Platform look like. Here, we have archived the Retrieval Benchmarks in the IR Experiment Platform.

The archived shared task repositories allow post-hoc experiments, and we provide several tutorials with examples in Jupyter Notebooks.

To start the jupyter notebook, please clone the archived shared task repository:

git clone [email protected]:tira-io/ir-experiment-platform-benchmarks.git

Inside the cloned repository, you can start the Jupyter notebook which automatically installs a minimal virtual environment using:

make jupyterlab

The installation of the environment is simplified with a virtual environment and executing make jupyterlab installs the virtual environment (if not already done) and starts the jupyter notebook ready to run all parts of the tutorial.

For each of the softwares submitted to TIRA, the tira integration to PyTerrier loads the Docker Image submitted to TIRA to execute it in PyTerrier pipelines (i.e., a first execution could take sligthly longer).

The following tutorial notebooks are available:

Tutorial.ipynb: A general purpose tutorial showing the first steps.
full-rank-retriever-tutorial.ipynb: showcases how full-rankers can be reproduced/replicated.
re-rank-tutorial.ipynb: showcases how re-rankers can be reproduced/replicated.
interoparability-tutorial.ipynb: showcases how full-rankers and re-rankers submitted in TIRA can be combined in new ways in post-hoc experiments.

Up-To-Date Leaderboards

Comparing the leaderboards accross different tasks is quite interesting (we have a large scale evaluation on that in the paper), e.g., compare MS MARCO DL 2019 with Antique or Args.me: On MS MARCO, all kinds of deep learning models are at the top, which totally reverses for other corpora, e.g., Args.me or Antique.

The current leaderboards can be viewed in tira.io:

Antique
Args.me 2020 Task 1
Args.me 2021 Task 1
Cranfield
TREC COVID
TREC Deep Learning 2019 (passage)
TREC Deep Learning 2020 (passage)
TREC Genomics 2004
TREC Genomics 2005
TREC 7
TREC 8
Robust04
TREC Web Track 2002 (gov)
TREC Web Track 2003 (gov)
TREC Web Track 2004 (gov)
TREC Web Track 2009 (ClueWeb09)
TREC Web Track 2010 (ClueWeb09)
TREC Web Track 2011 (ClueWeb09)
TREC Web Track 2012 (ClueWeb09)
TREC Web Track 2013 (ClueWeb12)
TREC Web Track 2014 (ClueWeb12)
Touché 2020 Task 2 (ClueWeb12)
Touché 2021 Task 2 (ClueWeb12)
Touché 2023 Task 2 (ClueWeb22) (Task is still ongoing, so the leaderboard is not yet public)
TREC Terabyte 2004 (gov2)
TREC Terabyte 2005 (gov2)
TREC Terabyte 2006 (gov2)
NFCorpus
Vaswani
TREC Core 2018 (wapo)
TREC Precision Medicine 2017
TREC Precision Medicine 2018

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Shared Task on ir-benchmarks

Up-To-Date Leaderboards

About

Releases

Packages

Contributors 2

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 6,471 Commits
.tira		.tira
antique-test-20230107-training/tira-ir-starter		antique-test-20230107-training/tira-ir-starter
argsme-touche-2020-task-1-20230209-training/tira-ir-starter		argsme-touche-2020-task-1-20230209-training/tira-ir-starter
argsme-touche-2021-task-1-20230209-training/tira-ir-starter		argsme-touche-2021-task-1-20230209-training/tira-ir-starter
beir-dbpedia-entity-test-20230108-training/tira-ir-starter/2023-01-08-18-21-10		beir-dbpedia-entity-test-20230108-training/tira-ir-starter/2023-01-08-18-21-10
clinicaltrials-2017-trec-pm-2017-20230107-training/tira-ir-starter		clinicaltrials-2017-trec-pm-2017-20230107-training/tira-ir-starter
clueweb09-en-trec-web-2009-20230107-training/tira-ir-starter		clueweb09-en-trec-web-2009-20230107-training/tira-ir-starter
clueweb09-en-trec-web-2010-20230107-training/tira-ir-starter		clueweb09-en-trec-web-2010-20230107-training/tira-ir-starter
clueweb09-en-trec-web-2011-20230107-training/tira-ir-starter		clueweb09-en-trec-web-2011-20230107-training/tira-ir-starter
clueweb09-en-trec-web-2012-20230107-training/tira-ir-starter		clueweb09-en-trec-web-2012-20230107-training/tira-ir-starter
clueweb12-touche-2020-task-2-20230209-training/tira-ir-starter		clueweb12-touche-2020-task-2-20230209-training/tira-ir-starter
clueweb12-touche-2021-task-2-20230209-training/tira-ir-starter		clueweb12-touche-2021-task-2-20230209-training/tira-ir-starter
clueweb12-trec-web-2013-20230107-training/tira-ir-starter		clueweb12-trec-web-2013-20230107-training/tira-ir-starter
clueweb12-trec-web-2014-20230107-training/tira-ir-starter		clueweb12-trec-web-2014-20230107-training/tira-ir-starter
cord19-fulltext-trec-covid-20230107-training/tira-ir-starter		cord19-fulltext-trec-covid-20230107-training/tira-ir-starter
cranfield-20230107-training/tira-ir-starter		cranfield-20230107-training/tira-ir-starter
disks45-nocr-trec-robust-2004-20230209-training/tira-ir-starter		disks45-nocr-trec-robust-2004-20230209-training/tira-ir-starter
disks45-nocr-trec7-20230209-training/tira-ir-starter		disks45-nocr-trec7-20230209-training/tira-ir-starter
disks45-nocr-trec8-20230209-training/tira-ir-starter		disks45-nocr-trec8-20230209-training/tira-ir-starter
gov-trec-web-2002-20230209-training/tira-ir-starter		gov-trec-web-2002-20230209-training/tira-ir-starter
gov-trec-web-2003-20230209-training/tira-ir-starter		gov-trec-web-2003-20230209-training/tira-ir-starter
gov-trec-web-2004-20230209-training/tira-ir-starter		gov-trec-web-2004-20230209-training/tira-ir-starter
gov2-trec-tb-2004-20230209-training/tira-ir-starter		gov2-trec-tb-2004-20230209-training/tira-ir-starter
gov2-trec-tb-2005-20230209-training/tira-ir-starter		gov2-trec-tb-2005-20230209-training/tira-ir-starter
gov2-trec-tb-2006-20230209-training/tira-ir-starter		gov2-trec-tb-2006-20230209-training/tira-ir-starter
medline-2004-trec-genomics-2004-20230107-training/tira-ir-starter		medline-2004-trec-genomics-2004-20230107-training/tira-ir-starter
medline-2004-trec-genomics-2005-20230107-training/tira-ir-starter		medline-2004-trec-genomics-2005-20230107-training/tira-ir-starter
medline-2017-trec-pm-2017-20230211-training/tira-ir-starter		medline-2017-trec-pm-2017-20230211-training/tira-ir-starter
medline-2017-trec-pm-2018-20230211-training/tira-ir-starter		medline-2017-trec-pm-2018-20230211-training/tira-ir-starter
msmarco-passage-trec-dl-2019-judged-20230107-training/tira-ir-starter		msmarco-passage-trec-dl-2019-judged-20230107-training/tira-ir-starter
msmarco-passage-trec-dl-2020-judged-20230107-training/tira-ir-starter		msmarco-passage-trec-dl-2020-judged-20230107-training/tira-ir-starter
nfcorpus-test-20230107-training/tira-ir-starter		nfcorpus-test-20230107-training/tira-ir-starter
vaswani-20230107-training/tira-ir-starter		vaswani-20230107-training/tira-ir-starter
wapo-v2-trec-core-2018-20230107-training/tira-ir-starter		wapo-v2-trec-core-2018-20230107-training/tira-ir-starter
.gitignore		.gitignore
.gitlab-ci.yml		.gitlab-ci.yml
Makefile		Makefile
README.md		README.md
Tutorial.ipynb		Tutorial.ipynb
full-rank-retriever-tutorial.ipynb		full-rank-retriever-tutorial.ipynb
interoparability-tutorial.ipynb		interoparability-tutorial.ipynb
re-rank-tutorial.ipynb		re-rank-tutorial.ipynb
requirements.txt		requirements.txt

tira-io/ir-experiment-platform-benchmarks

Folders and files

Latest commit

History

Repository files navigation

Shared Task on ir-benchmarks

Up-To-Date Leaderboards

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages