ILES

Information Langue Écrite et Signée (ILES)

Le groupe ILES se consacre au traitement des données langagières écrites (à leur analyse, leur compréhension ou leur production ainsi qu’à l’acquisition des connaissances nécessaires pour y arriver) et signées (modélisation et traitement automatique des langues des signes).

L’ambition est de maintenir des compétences variées et complémentaires pour combiner à la fois approches symboliques et statistiques, ainsi que des aspects fondamentaux et plus appliqués.

Les activités de recherche du groupe ILES s’organisent autour de quatre thèmes

Le thème Corpus et représentations concerne l’étude des événements linguistiques tels qu’ils se manifestent dans les systèmes de représentation graphiques et signés utilisés par les humains pour communiquer. Dans nos travaux de recherche, nous explorons des corpus, c’est-à-dire des collections de documents, créés selon une hypothèse de travail, ayant des origines diverses : transcription de parole, livres, articles, journaux, rapports, pages web, blogs, microblogs, vidéos de langue des signes etc.

Ce thème de recherche se consacre à l’analyse de productions langagières de même sens mais de formes différentes, problématique au cœur de la sémantique. Cette question s’étend au multilinguisme, question récurrente lors du développement d’un système. Ce thème interagit de façon transverse avec chacun des trois autres thèmes du groupe ILES, ainsi qu’avec l’activité de traduction du groupe TLP.

Deux axes principaux dans ce thème :

Le premier est centré sur la reconnaissance d’informations précises dans des textes, avec deux principaux champs d’étude :

  • Extraction d’information : reconnaissance et typage d’informations pour construire des bases de connaissances ou analyser des textes
  • Recherche d’information précise : retrouver des informations dans des textes ou des bases de connaissances en réponse à des questions en langue naturelle

Un second axe concerne la modélisation des processus permettant une interaction en langue naturelle pour interroger la machine, que ce soit pour la recherche d’information, dans un domaine particulier (par exemple sur un site marchand, dans des textes scientifiques) ou en domaine ouvert (recherche dans une base de connaissances ou dans des textes encyclopédiques), et aussi en tant qu’assistant personnel.

À travers de nombreuses collaborations, nous produisons des ressources linguistiques et nous abordons des problématiques d’analyse, de représentation et de traitement de la LSF de manière interdisciplinaire, avec des points de vue de plusieurs domaines de l’informatique (TAL, traitement du signal, vision par ordinateur, informatique graphique), ainsi que des sciences du langage, du mouvement et de la perception.

Coordination

Publications récentes

  • Communication dans un congrès

    Clémence Sebe, Aurélie Névéol, Sarah Cohen-Boulakia, Alban Gaignard. Extraction d'informations sur les workflows scientifiques à partir de la littérature. 23ème conférence francophone sur l'Extraction et la Gestion des Connaissances (EGC), Jan 2023, Lyon, France. pp.313-320. ⟨hal-03991363⟩

    BioInfo, ILES

    Année de publication

    Disponible en libre accès

  • Communication dans un congrès

    Nesrine Bannour, Aurélie Névéol, Xavier Tannier, Bastien Rance. Traitement Automatique de la Langue et Intégration de Données pour les Réunions de Concertations Pluridisciplinaires en Oncologie. TAL & IA 2021, AfIA; ATALA, Feb 2021, Virtuel – Online, France. ⟨hal-04013495⟩

    ILES

    Année de publication

  • Communication dans un congrès

    Nesrine Bannour, Perceval Wajsbürt, Bastien Rance, Xavier Tannier, Aurélie Névéol. Modèles préservant la confidentialité des données par mimétisme pour la reconnaissance d’entités nommées en français. Journée d’étude sur la robustesse des systemes de TAL, ATALA, Nov 2022, Paris, France. ⟨hal-04013420⟩

    ILES

    Année de publication

    Disponible en libre accès

  • Poster de conférence

    Marine Boeuf, Florelle Bellet, Pierre Karapetiantz, Damien Leprovost, François Morlane-Hondère, et al.. A pilot study of the Vigi4MED project: comparison of adverse drug reactions (ADRs) of duloxetine between patients' forum posts and the French pharmacovigilance database (FPVD). Congrès annuel de la Société Française de Pharmacologie et de Thérapeutique, Apr 2017, Rouen, France. Fundamental & Clinical Pharmacology, 31, pp.33, 2017. ⟨hal-04009735⟩

    ILES

    Année de publication

  • Article dans une revue

    Emmanuella Martinod. Originalité de la langue des signes micro-communautaire de l’île du Marajó (Brésil) par rapport à la langue des signes institutionnelle brésilienne (Libras).. Revista Científica Sigma , 2022, Dossiê – Línguas de Sinais: acessibilidade, emergência e práticas pedagógicas inclusivas, 3 (2), pp.27-46. ⟨hal-03951325⟩

    ILES

    Année de publication

    Disponible en libre accès

  • Thèse

    Mathilde Veron. Systèmes de dialogue apprenant tout au long de leur vie : de l'élaboration à l'évaluation. Informatique et langage [cs.CL]. Université Paris-Saclay, 2022. Français. ⟨NNT : 2022UPASG089⟩. ⟨tel-04000738⟩

    ILES

    Année de publication

    Disponible en libre accès

  • Chapitre d'ouvrage

    Natalia Grabar, Thierry Hamon, Benoît Leclercq. Modals as a predictive factor for L2 proficiency level. Models of modals: From pragmatics and corpus linguistics to machine learning, Topics in English Linguistics [TiEL] (110), De Gruyter Mouton, pp. 199-224, 2023, 9783110738612. ⟨hal-03997709⟩

    ILES

    Année de publication

  • Article dans une revue

    Lori Lamel, Sophie Rosset, Jean-Luc Gauvain, Samir Bennacef, Martine Garnier-Rizet, et al.. The LIMSI Arise System. Speech Communication, 2000, 31 (4), pp.339-353. ⟨hal-03981169⟩

    ILES, TLP

    Année de publication

  • Communication dans un congrès

    Valérie Delavigne, Myriam Bouveret, Anne Condamines, Pierre Zweigenbaum. Terminologie et corpus : la question du genre et de la variation. Conférence Fédérative sur le Document. CFD 2002, Oct 2002, Hammamet, Tunisie. ⟨hal-03752796⟩

    ILES

    Année de publication

  • Communication dans un congrès

    Lucie Metz, Virginie Zampa, Annelies Braffort. Plat'in : Plateforme pour l'apprentissage de la LSF, étude préliminaire et spécification. Atelier “EIAH et Situations de handicap”, May 2013, Toulouse, France. ⟨hal-03840085⟩

    ILES

    Année de publication