Du

Horaire -

Lieu

Journées, STL

Constituer, enrichir et exploiter les données de parole

Journée d'étude organisée par l'Association Francophone de la Communication Parlée

Présentation

Les données constituent le socle de la recherche sur la parole. Qu’il s’agisse d’étudier les mécanismes de production et de perception, les interactions verbales ou de développer des modèles et outils de traitement automatique, la qualité, la diversité et la disponibilité des données jouent un rôle déterminant. L’évolution des méthodes d’acquisition, d’annotation et d’analyse, ainsi que l’émergence de nouveaux besoins liés à la diversité linguistique et aux approches fondées sur les données, invitent aujourd’hui à réfléchir collectivement aux ressources que nous produisons et utilisons.

Organisée par l’Association Francophone de la Communication Parlée (AFCP), cette journée d’étude propose un espace d’échange autour des données de parole, de leur collecte à leur exploitation. Les présentations et tables rondes de la matinée aborderont différents types de données (production de la parole, interactions, corpus bruités), ainsi que les enjeux liés aux langues peu dotées et aux stratégies d’augmentation de données. L’après-midi sera consacré à des ateliers pratiques permettant de découvrir des méthodes et outils pour la visualisation de données audio et l’annotation automatique.

Programme

Présentations et tables rondes

Chaque séance est composée de 3 présentations de 10 minutes suivies d’une discussion entre les intervenants de 15 minutes.

1) Données type production (articulatoire – production – langue du monde)

9h30 – 9h40 : Documentation de langue – Bowei Shao (LPP)
9h40 – 9h50 : Phonétique clinique / Données physiologiques – Alain Ghio (LPL)
9h50 – 10h00 : Données pour modélisation – Yves Laprie (LORIA)

10h15 – 10h30 : Pause

2) Données type interaction (données audio-visuelles – labo ou réelle)
10h30 – 10h40 : Interactions multimodales – Roxane Bertrand (LPL)
10h40 – 10h50 : Interaction humain-robot/avatar – Chloé Clavel (Inria)
10h50 – 11h00 : Annotation de données acoustiques en interaction – Rémi Uro (LIASD)

11h15 – 11h30 : Pause

3) Données bruitée (type massive / terrain qualité)
11h30 – 11h40 : Transcription de données bruitées – Benjamin Lecouteux (LIG)
11h40 – 11h50 : Dysarthrie / Phonétique clinique – Véronique Delvaux, Kathy Huet (Université de Mons)
11h50 – 12h00 : Augmentation de données  – Marc Evrard (LISN)

12h15 – 13h45 : Pause déjeuner

Ateliers

La participation aux ateliers requiert un ordinateur portable personnel. Les logiciels nécessaires seront précisés en amont de la journée afin que les participants puissent les installer avant l’événement.

13h45 – 15h15 : Visualisation de données audio – Cédric Gendrot (LPP)
15h30 – 17h00 : Outils d’annotations automatiques – Mélanie Lancien (ATILF)

Inscription

La participation à la journée est gratuite, mais l’inscription est obligatoire pour des raisons d’organisation.

Les places aux ateliers étant limitées, les doctorantes et doctorants seront prioritaires pour l’inscription aux sessions pratiques.

Lien d’inscription : https://forms.gle/aGS8LnY9ALopys2T6

Comité d’organisation

Lieu

Université Sorbonne Nouvelle
8 avenue de Saint Mandé
75012 ParisComité d’organisation

Accès
Métro : Ligne 6 – Station Picpus ; Lignes 1, 2, 9 – Station Nation
RER A – Station Nation
Bus : Ligne 29 – Arrêt Fabre d’Eglantine

Lieu de l'événement