ILES

Extraction et reconnaissance d’informations précises

Permanents: S. Ghannay, C. Grouin, T. Hamon, G. Illouz, T. Lavergne, AL. Ligozat, A. Névéol, S. Rosset, P. Zweigenbaum, avec la participation de P. Paroubek et A. Vilnat. Doctorants: H Boulanger, O Cattan, JM Coria, H El Boukkouri, L Galmant (ILES/TLP), C Masson, N Paris, TF Randriatsitohaina, LP Schaub, M Véron

Deux axes principaux dans ce thème.

Le premier est centré sur la reconnaissance d’informations précises dans des textes, avec deux principaux champs d’étude :

  • Extraction d’information : reconnaissance et typage d’informations pour construire des bases de connaissances ou analyser des textes
  • Recherche d’information précise : retrouver des informations dans des textes ou des bases de connaissances en réponse à des questions en langue naturelle

Un second axe concerne la modélisation des processus permettant une interaction en langue naturelle pour interroger la machine, que ce soit pour la recherche d’information, dans un domaine particulier (par exemple sur un site marchand, dans des textes scientifiques) ou en domaine ouvert (recherche dans une base de connaissances ou dans des textes encyclopédiques), et aussi en tant qu’assistant personnel.

Thèmes développés :

  • Reconnaissance d’entités nommées en domaine général et en domaine de spécialité (biomédical essentiellement), reconnaissance de types complexes, prise en compte du phénomène de rareté lexicale
  • Extraction de relations en domaine général et en domaine de spécialité (biomédical essentiellement), avec des approches supervisées et non supervisées, fondée sur des informations de surface et des représentations structurées
  • Reconnaissance d’événements et d’information temporelle, extraction de chronologies
  • Détection d’opinion
  • Représentation et inférence sémantique pour répondre à des questions sur des textes et pour l’interrogation de bases de connaissances
  • Modélisation de l’interaction humain-machine en langue naturelle, systèmes de dialogue