Stage

Modélisation automatique des variations phonétiques en français et en japonais : une approche comparative par apprentissage automatique

Position type : IA, Sciences et Technologies des langues

Stage de 6 mois de Master/Ecole d'Ingénieur.es

1 document Published on

Laboratoire d’accueil

LISN (Laboratoire Interdisciplinaire des Sciences du Numérique)

Encadrement

Camille Guinaudeau (LISN STL), Anisia Popescu (ex-LISN, Paris 8), Ioana Vasilescu (LISN STL)

Candidature à envoyer à camille.guinaudeau@lisn.fr et ioana.vasilescu@lisn.fr

Contexte scientifique

Les variations phonétiques (réductions, assimilations, etc.) reflètent des contraintes articulatoires, des normes sociales et des contextes d’usage spécifiques. Ce sont des phénomènes influencés par des facteurs sociolinguistiques (âge, genre, registre, rôle du locuteur) et contextuels (thème, émotion). Ce stage se déroulera dans le cadre d’un projet visant à modéliser automatiquement ces variations à partir de corpus médias enrichis de métadonnées socio-démographiques, en utilisant des méthodes d’apprentissage automatique. Le stage se focalisera sur deux langues, français et japonais, et s’appuiera sur des données média disponibles dans les deux langues.

Objectifs du stage

Les prochains axes de recherche seront abordés pendant le stage :

  • Alignement et Enrichissement de corpus médias (français : ESTER, ETAPE ; japonais : NHK) avec des métadonnées socio-démographiques et phonétiques.
  • L’identification et l’analyse d’un ensemble de phénomènes de réduction phonétique ciblés dans les deux langues, en s’appuyant sur un état de l’art récent.
  • La modélisation automatique des facteurs responsables de ces variations (phonétiques, sociolinguistiques, contextuels) à l’aide d’outils d’apprentissage automatique.
  • La comparaison interculturelle des mécanismes de variation entre le français et le japonais, afin d’identifier des points communs et des spécificités liées à chaque langue.

Profil recherché

  • Étudiant(e) en master (linguistique, TALTraitement Automatique des langues, informatique, sciences cognitives) ou école d’ingénieur.
  • Intérêt pour la phonétique, la sociolinguistique et l’apprentissage automatique.
  • Compétences en traitement de données et en analyse statistique (R, Python).
  • Curiosité pour les approches interculturelles et la modélisation linguistique.

Durée, période et rémunération

6 mois, à partir de février/mars 2026, gratification de stage.