M3

Modèles, Méthodes et Multilinguisme (M3)

Coordination : Albert Rilliard

L’équipe M3 s’intéresse aux modèles et méthodes visant à décrire fondamentalement et à traiter automatiquement le langage naturel humain et sa dimension multilingue. Il s’agit de développer des modèles et des méthodes à même de traiter, extraire et décrire des caractéristiques pertinentes de ces systèmes à partir de corpus. Nous considérons les langages dans tous leurs usages, et avec un intérêt spécifique pour la prise en considération des langues peu dotées, ainsi que pour la comparaison de ces langages entre eux (approches multilingues). Une des caractéristiques de l’équipe est de s’intéresser à ces questions dans l’interaction entre modèles et systèmes : qu’est-ce qu’un modèle nous permet de comprendre sur un langage ? En quoi un ensemble de langages se différencie, et à quels niveaux ? Comment utiliser des modèles génératifs pour créer des instances contrôlées de certains phénomènes ? La mise en place de modèles explicables et adaptés aux objets étudiés permet l’interaction entre disciplines et promeut les travaux interdisciplinaires (informatique, sciences du langage, sociologie, psychologie). Les recherches menées dans l’équipe M3 relèvent de trois grands axes :

A- Modèles et Méthodes

Les travaux portent sur les paradigmes d’apprentissage : développement de modèles de données et d’algorithmes (modèles avec beaucoup ou peu de paramètres, génératifs ou non), dans l’optique de leur application au traitement automatique des langues et des langages en tant qu’objets structurés. Ces modèles sont typiquement appliqués aux objets étudiés dans les deux autres axes. Une attention particulière est portée aux questions liées à l’accessibilité : réfléchir aux méthodes spécifiques à mettre en place pour développer des technologies inclusives pour notre société. Des modèles efficaces, sobres, adaptés à la représentation de données spécifiques sont particulièrement recherchés pour promouvoir des approches explicables et responsables des données étudiées. Ces modèles permettent de créer des solutions hybrides pour essayer de contrôler les IA génératives. Ils apportent également des approches qui peuvent servir à construire des systèmes plus éthiques.

B- Typologie, Variation et Universaux des Langues

Ces travaux portent sur la description de caractéristiques des systèmes linguistiques sur la base de corpus. Il s’agit ici d’appliquer de manière automatique des schémas typologiques, puis de comparer les langues selon ces caractéristiques. La prise en compte de la variation constitue un point majeur, avec des travaux sur les changements diatopiques, diastratiques, diaphasiques, ou diachroniques au sein d’une langue, ou lors de contacts de langues (bien ou peu dotées). Les systèmes syntaxiques, phonologiques, phonétiques, articulatoires et prosodiques sont considérés. La représentation (en termes de distances ou projetées sur un atlas) des différences entre les systèmes étudiés est aussi mise en avant.

C- Interactions Situées et Comportementale

Les travaux de modélisation et de description des performances  lors d’interactions communicationnelles situées, aux niveaux para et extra-linguistiques: que ce soit au niveau des fonctions pragmatiques (actes de parole, nuances attitudinales), des émotions (interaction affective, émotions sociales), des nudges (manipulation douce), de l’effort vocal (parole Lombard, force de voix), etc. Il s’agit de proposer des modèles des changements comportementaux liés à ces phénomènes, pour pouvoir les détecter, en mesurer la variation ou la dynamique, les catégoriser. L’analyse des paramètres acoustico-linguistiques de la voix (paramètres issus de modèles, source glottique, choix articulatoires, etc.) permet de faire le lien entre les performances et les fonctions.

Actualités

L’équipe se compose de 9 membres permanents (chercheurs CNRS, enseignants-chercheurs à l’Université Paris-Saclay), 6 doctorants, et 9 personnes ingénieures ou chercheurs CDD. Nous entretenons des liens avec les industriels (thèses en contrat CIFRE, projets de recherche) et organisons régulièrement des manifestations scientifiques (conférence TALN, ateliers et workshops scientifiques, etc.).

Membres de l’équipe