Modèles, Méthodes et Multilinguisme (M3)

Coordination : Albert Rilliard

L’équipe M3 s’intéresse aux modèles et méthodes visant à décrire fondamentalement et à traiter automatiquement le langage naturel humain et sa dimension multilingue. Il s’agit de développer des modèles et des méthodes à même de traiter, extraire et décrire des caractéristiques pertinentes de ces systèmes à partir de corpus. Nous considérons les langages dans tous leurs usages, et avec un intérêt spécifique pour la prise en considération des langues peu dotées, ainsi que pour la comparaison de ces langages entre eux (approches multilingues). Une des caractéristiques de l’équipe est de s’intéresser à ces questions dans l’interaction entre modèles et systèmes : qu’est-ce qu’un modèle nous permet de comprendre sur un langage ? En quoi un ensemble de langages se différencie, et à quels niveaux ? Comment utiliser des modèles génératifs pour créer des instances contrôlées de certains phénomènes ? La mise en place de modèles explicables et adaptés aux objets étudiés permet l’interaction entre disciplines et promeut les travaux interdisciplinaires (informatique, sciences du langage, sociologie, psychologie). Les recherches menées dans l’équipe M3 relèvent de trois grands axes :

A- Modèles et Méthodes

Les travaux portent sur les paradigmes d’apprentissage : développement de modèles de données et d’algorithmes (modèles avec beaucoup ou peu de paramètres, génératifs ou non), dans l’optique de leur application au traitement automatique des langues et des langages en tant qu’objets structurés. Ces modèles sont typiquement appliqués aux objets étudiés dans les deux autres axes. Une attention particulière est portée aux questions liées à l’accessibilité : réfléchir aux méthodes spécifiques à mettre en place pour développer des technologies inclusives pour notre société. Des modèles efficaces, sobres, adaptés à la représentation de données spécifiques sont particulièrement recherchés pour promouvoir des approches explicables et responsables des données étudiées. Ces modèles permettent de créer des solutions hybrides pour essayer de contrôler les IA génératives. Ils apportent également des approches qui peuvent servir à construire des systèmes plus éthiques.

B- Typologie, Variation et Universaux des Langues

Ces travaux portent sur la description de caractéristiques des systèmes linguistiques sur la base de corpus. Il s’agit ici d’appliquer de manière automatique des schémas typologiques, puis de comparer les langues selon ces caractéristiques. La prise en compte de la variation constitue un point majeur, avec des travaux sur les changements diatopiques, diastratiques, diaphasiques, ou diachroniques au sein d’une langue, ou lors de contacts de langues (bien ou peu dotées). Les systèmes syntaxiques, phonologiques, phonétiques, articulatoires et prosodiques sont considérés. La représentation (en termes de distances ou projetées sur un atlas) des différences entre les systèmes étudiés est aussi mise en avant.

Atlas sonore

http://atlas.limsi.fr/

C- Interactions Situées et Comportementale

Les travaux de modélisation et de description des performances lors d’interactions communicationnelles situées, aux niveaux para et extra-linguistiques: que ce soit au niveau des fonctions pragmatiques (actes de parole, nuances attitudinales), des émotions (interaction affective, émotions sociales), des nudges (manipulation douce), de l’effort vocal (parole Lombard, force de voix), etc. Il s’agit de proposer des modèles des changements comportementaux liés à ces phénomènes, pour pouvoir les détecter, en mesurer la variation ou la dynamique, les catégoriser. L’analyse des paramètres acoustico-linguistiques de la voix (paramètres issus de modèles, source glottique, choix articulatoires, etc.) permet de faire le lien entre les performances et les fonctions.

Actualités

Colloque, Sciences et Technologies des langues

LT4All 2025 : Technologies de la langue pour tous
Sciences et Technologies des langues

EcAuTAL, l'école d'automne en TAL du département STL
Ethique, Sciences et Technologies des langues

Qui a hacké Garoutzia ?

Toutes les actualités

L’équipe se compose de 9 membres permanents (chercheurs CNRS, enseignants-chercheurs à l’Université Paris-Saclay), 6 doctorants, et 9 personnes ingénieures ou chercheurs CDD. Nous entretenons des liens avec les industriels (thèses en contrat CIFRE, projets de recherche) et organisons régulièrement des manifestations scientifiques (conférence TALN, ateliers et workshops scientifiques, etc.).

Membres de l’équipe

Sciences et Technologies des Langues

M3

Adda Gilles

Responsable de l'équipe M3

Ingénieur de recherche
Sciences et Technologies des Langues

M3

Bonneau Hélène

Enseignante-chercheuse
Sciences et Technologies des Langues

M3

Botero Garcia Maria Paz
Sciences et Technologies des Langues

M3

Boula De Mareuil Philippe

Directeur de recherche

Page personnelle
Sciences et Technologies des Langues

M3

Catalán Gris Lucia

Doctorante

Courriel
Sciences et Technologies des Langues

M3

Devauchelle Simon

Doctorant
Sciences et Technologies des Langues

M3

Devillers Laurence

Professeure à Sorbonne Université

Chercheuse en Intelligence Artificielle

Présidente de la Fondation Blaise Pascal de médiation en mathématique

Courriel
Sciences et Technologies des Langues

LIPSLangue Interaction Parole et Signes, M3

Evrard Marc

Maitre de conférences

Page personnelle
Sciences et Technologies des Langues

M3

Faghiri-Lécaille Pegah
Sciences et Technologies des Langues

M3

Gerdes Kim

Courriel
Sciences et Technologies des Langues

M3

Kande Seydina
Sciences et Technologies des Langues

M3

Lavergne Thomas

Maître de conférences
Sciences et Technologies des Langues

M3

Le Tellier Quentin
Sciences et Technologies des Langues

LIPSLangue Interaction Parole et Signes, M3

Lienard Jean-Sylvain

Chercheur émérite
Sciences et Technologies des Langues

M3

Liu Jianying
Sciences et Technologies des Langues

M3

Luong Ethan

Stagiaire de Recherche

Courriel
Sciences et Technologies des Langues

M3

Mariani Joseph

Directeur de Recherche Emérite

0169157856

Courriel

Page personnelle
Sciences et Technologies des Langues

M3

Ondel Yang Lucas

Chargé de Recherche

Courriel
Sciences et Technologies des Langues

M3

Peng Valerie
Sciences et Technologies des Langues

M3

Rilliard Albert

Chercheur
Sciences et Technologies des Langues

M3

Tallot Quentin
Sciences et Technologies des Langues

M3

Uro Remi

Doctorant
Sciences et Technologies des Langues

M3

Uthayasooriyar Benno

Doctorant