corpus

Time-Domain Astrophysics Corpus

TDAC

Création le :

Mis a jour le :

Cyril Grouin
En maintenance

TDAC est un corpus composé de 300 rapports d'observation en astrophysique. Le corpus est annoté en entités nommées, en coréférences et en relation (entre objets célestes et leurs propriétés physiques). Ce corpus sert pour l'entraînement de systèmes d'extraction d'information.

Notes :

En cours de développement d'une version V2 pour LREC 2024. Autres contacts: Atilla Kaan Alkan, Fabian Schüssler (CEA), Pierre Zweigenbaum