LIPS

Langue Interaction Parole et Signes (LIPS)

Coordination : Ioana VASILESCU

Les enjeux scientifiques de l’équipe LIPS concernent les langues orales, parlées et signées avec des objectifs de description linguistique et de modélisation. Nous visons une variété d’applications telles que la reconnaissance vocale, les systèmes de dialogue, la détection automatique des états affectifs, la compréhension et la génération, la synthèse de la parole, le traitement automatique des langues des signes. La dimension éthique est au cœur de nos travaux, de la mise en place de paradigmes expérimentaux aux usages de nos résultats de recherche.

L’équipe réunit ainsi des chercheurs en traitement automatique des langues et des linguistes autour d’approches centrées sur la dimension située de la langue : nous faisons appel à une variété de données, de taille et de sources différentes illustrant la variation linguistique dans toutes ses dimensions, des unités minimales au sens.

Le traitement multimodal impliquant la combinatoire variété écrite et orale des langues parlées tout comme d’autres informations visuelles (par exemple, occulométrie) est également au centre de nos préoccupations.

L’équipe se compose de 13 membres permanents (chercheur.euses CNRS, enseignant.es-chercheur.euses à l’Université Paris-Saclay), 17 chercheurs et chercheuses en doctorat, et 13 chercheurs et chercheuses contractuel.les. Nous entretenons des liens avec les industriels (thèses en contrat CIFRE, projets de recherche) et organisons régulièrement des manifestations scientifiques.

Coordination

  • Sciences et Technologies des Langues

    LIPS

    Vasilescu Ioana

    Directrice de recherche (DR2)

    Responsable équipe LIPS

    Linguistique de corpus, variations de l'oral, corpus multilingues

Membres de l’équipe

Publications

  • Communication dans un congrès

    Rabab Alkhalifa, Hsuvas Borkakoty, Romain Deveaud, Alaa El-Ebshihy, Luis Espinosa-Anke, et al.. LongEval: Longitudinal Evaluation of Model Performance at CLEF 2024. Advances In Information Retrieval (ECIR 2024), Mar 2024, Glasgow (Ecosse), United Kingdom. pp.60-66, ⟨10.1007/978-3-031-56072-9_8⟩. ⟨hal-04577466⟩

    STL

    Année de publication

  • Article dans une revue

    Boya Zhang, Nona Naderi, Rahul Mishra, Douglas Teodoro. Online Health Search Via Multidimensional Information Quality Assessment Based on Deep Language Models: Algorithm Development and Validation. JMIR AI, 2024, 3, pp.e42630. ⟨10.2196/42630⟩. ⟨hal-04574791⟩

    STL

    Année de publication

    Disponible en libre accès

  • Article dans une revue

    Hossein Rouhizadeh, Irina Nikishina, Anthony Yazdani, Alban Bornet, Boya Zhang, et al.. A Dataset for Evaluating Contextualized Representation of Biomedical Concepts in Language Models. Scientific Data , 2024, 11 (1), pp.455. ⟨10.1038/s41597-024-03317-w⟩. ⟨hal-04574786⟩

    STL

    Année de publication

    Disponible en libre accès

  • Communication dans un congrès

    Maxime Fily, Guillaume Wisniewski, Séverine Guillaume, Gilles Adda, Alexis Michaud. Establishing degrees of closeness between audio recordings along different dimensions using large-scale cross-lingual models. Findings of the Association for Computational Linguistics: EACL 2024, Association for Computational Linguistics, Mar 2024, St. Julian’s, Malta. ⟨hal-04561819⟩

    STL

    Année de publication

    Disponible en libre accès

  • Communication dans un congrès

    Hugo Boulanger, Nicolas Hiebel, Olivier Ferret, Karën Fort, Aurélie Névéol. Using Structured Health Information for Controlled Generation of Clinical Cases in French. The 6th Clinical Natural Language Processing Workshop At NAACL 2024 (ClinicalNLP 2024), Jun 2024, Mexico city, Mexico. ⟨hal-04558890⟩

    STL

    Année de publication

    Disponible en libre accès

  • Pré-publication, Document de travail

    Marion Ficher, Tom Bauer, Anne-Laure Ligozat. A comprehensive review of the end-of-life modeling in LCAs of digital equipment. 2024. ⟨hal-04555155⟩

    STL

    Année de publication

    Disponible en libre accès

  • Communication dans un congrès

    Nicolas Hiebel, Bertrand Remy, Bruno Guillaume, Olivier Ferret, Aurélie Névéol, et al.. Hostomytho: A GWAP for Synthetic Clinical Texts Evaluation and Annotation. Games and Natural Language Processing Workshop at LREC-COLING 2024, May 2024, Turin, Italy, May 2024, Turin (Italie), Italy. ⟨hal-04555052⟩

    STL

    Année de publication

    Disponible en libre accès

  • Thèse

    Oralie Cattan. Systèmes de questions-réponses interactifs à grande échelle. Informatique [cs]. Université Paris-Saclay (2020-..), 2022. Français. ⟨NNT : ⟩. ⟨tel-04551072⟩

    STL

    Année de publication

  • Article dans une revue

    Luma da Silva Miranda, João Antônio de Moraes, Albert Rilliard. Visual channel facilitates the comprehension of the intonation of Brazilian Portuguese wh-questions and wh-exclamations: evidence from congruent and incongruent stimuli. Language and Cognition, 2024, pp.1-21. ⟨10.1017/langcog.2024.16⟩. ⟨hal-04538371⟩

    STL

    Année de publication

    Disponible en libre accès

  • Pré-publication, Document de travail

    Mathilde Aguiar, Pierre Zweigenbaum, Nona Naderi. SEME at SemEval-2024 Task 2: Comparing Masked and Generative Language Models on Natural Language Inference for Clinical Trials. 2024. ⟨hal-04536273⟩

    STL

    Année de publication

    Disponible en libre accès