Ce dépôt contient les données de l'article "Uniformisation de corpus anglais annotés en sens" par Loïc Vial, Benjamin Lecouteux et Didier Schwab.
Notes :
-
Le dossier
/data
correspond au fichier/data.zip
décompressé -
Le fichier
/data.zip
se trouve à l'adresse suivante : https://www.mediafire.com/?lcf5xflhf7d3clh
Les ressources fournies sont les suivantes :
/data/corpus
Tous les corpus anglais annotés en sens WordNet portés à notre connaissance, dans le nouveau format que nous proposons. (quand les droits nous le permettent)
/data/corpus/original
Tous les corpus anglais annotés en sens WordNet portés à notre connaissance, dans leur format original. (quand les droits nous le permettent)
/src
Le code en langage Java qui nous a permis de convertir les corpus depuis leur format d'origine vers le nouveau format. Ainsi que du code pour écrire et lire le nouveau format de corpus.
/pom.xml
Fichier de projet Maven pour utiliser le code Java immédiatement (gère les dépendances etc.)