LIPS

Langue Interaction Parole et Signes (LIPS)

Coordination : Ioana VASILESCU

Les enjeux scientifiques de l’équipe LIPS concernent les langues orales, parlées et signées avec des objectifs de description linguistique et de modélisation. Nous visons une variété d’applications telles que la reconnaissance vocale, les systèmes de dialogue, la détection automatique des états affectifs, la compréhension et la génération, la synthèse de la parole, le traitement automatique des langues des signes. La dimension éthique est au cœur de nos travaux, de la mise en place de paradigmes expérimentaux aux usages de nos résultats de recherche.

L’équipe réunit ainsi des chercheurs en traitement automatique des langues et des linguistes autour d’approches centrées sur la dimension située de la langue : nous faisons appel à une variété de données, de taille et de sources différentes illustrant la variation linguistique dans toutes ses dimensions, des unités minimales au sens.

Le traitement multimodal impliquant la combinatoire variété écrite et orale des langues parlées tout comme d’autres informations visuelles (par exemple, occulométrie) est également au centre de nos préoccupations.

L’équipe se compose de 13 membres permanents (chercheur.euses CNRS, enseignant.es-chercheur.euses à l’Université Paris-Saclay), 17 chercheurs et chercheuses en doctorat, et 13 chercheurs et chercheuses contractuel.les. Nous entretenons des liens avec les industriels (thèses en contrat CIFRE, projets de recherche) et organisons régulièrement des manifestations scientifiques.

Coordination

  • Sciences et Technologies des Langues

    LIPS

    Vasilescu Ioana

    Directrice de recherche (DR2)

    Responsable équipe LIPS

    Linguistique de corpus, variations de l'oral, corpus multilingues

Membres de l’équipe

Publications

  • Communication dans un congrès

    Hugo Boulanger, Nicolas Hiebel, Olivier Ferret, Karën Fort, Aurélie Névéol. Using Structured Health Information for Controlled Generation of Clinical Cases in French. The 6th Clinical Natural Language Processing Workshop At NAACL 2024 (ClinicalNLP 2024), Jun 2024, Mexico city, Mexico. ⟨hal-04558890⟩

    STL

    Année de publication

    Disponible en libre accès

  • Communication dans un congrès

    Nicolas Hiebel, Bertrand Remy, Bruno Guillaume, Olivier Ferret, Aurélie Névéol, et al.. Hostomytho: A GWAP for Synthetic Clinical Texts Evaluation and Annotation. Games and Natural Language Processing Workshop at LREC-COLING 2024, May 2024, Turin, Italy, May 2024, Turin (Italie), Italy. ⟨hal-04555052⟩

    STL

    Année de publication

    Disponible en libre accès

  • Thèse

    Oralie Cattan. Systèmes de questions-réponses interactifs à grande échelle. Informatique [cs]. Université Paris-Saclay (2020-..), 2022. Français. ⟨NNT : ⟩. ⟨tel-04551072⟩

    STL

    Année de publication

  • Article dans une revue

    Luma da Silva Miranda, João Antônio de Moraes, Albert Rilliard. Visual channel facilitates the comprehension of the intonation of Brazilian Portuguese wh-questions and wh-exclamations: evidence from congruent and incongruent stimuli. Language and Cognition, 2024, pp.1-21. ⟨10.1017/langcog.2024.16⟩. ⟨hal-04538371⟩

    STL

    Année de publication

    Disponible en libre accès

  • Pré-publication, Document de travail

    Mathilde Aguiar, Pierre Zweigenbaum, Nona Naderi. SEME at SemEval-2024 Task 2: Comparing Masked and Generative Language Models on Natural Language Inference for Clinical Trials. 2024. ⟨hal-04536273⟩

    STL

    Année de publication

    Disponible en libre accès

  • Communication dans un congrès

    Djegdjiga Amazouz, Martine-Adda Decker, Lori Lamel. Variation du voisement des occlusives orales en code-switching: analyses par ABX automatique et mesures acoustiques. Journées d’Études sur la Parole – JEP2022, Jun 2022, Noirmoutier, France. ⟨hal-03703081⟩

    STL

    Année de publication

    Disponible en libre accès

  • Pré-publication, Document de travail

    Mathilde Aguiar, Pierre Zweigenbaum, Nona Naderi. SEME at SemEval-2024 Task 2: Comparing Masked and Generative Language Models on Natural Language Inference for Clinical Trials. 2024. ⟨hal-04536600⟩

    STL

    Année de publication

  • Communication dans un congrès

    Karën Fort, Laura Alonso Alemany, Luciana Benotti, Julien Bezançon, Claudia Borg, et al.. Your Stereotypical Mileage may Vary: Practical Challenges of Evaluating Biases in Multiple Languages and Cultural Contexts. The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation, May 2024, Turin (Italie), Italy. ⟨hal-04537096⟩

    STL

    Année de publication

    Disponible en libre accès

  • Communication dans un congrès

    Paul Lerner, Cyril Grouin. INCLURE: a Dataset and Toolkit for Inclusive French Translation. The 17th Workshop on Building and Using Comparable Corpora (BUCC @ LREC 2024), 2024, Turin, Italy. ⟨hal-04531938⟩

    STL

    Année de publication

    Disponible en libre accès

  • Proceedings/Recueil des communications

    Karën Fort, Aurélie Névéol. Ethics and NLP: 10 years after. Journée d’études ATALA “éthique et TALTraitement Automatique des langues : 10 ans après”, 2024. ⟨hal-04533870⟩

    STL

    Année de publication

    Disponible en libre accès