STL

Sciences et Technologies des Langues

Le département Sciences et Technologies des Langues étudie des questions fondamentales relatives aux systèmes linguistiques par l’exploitation de larges corpus collectés, annoté et enrichis de manière non-supervisée ou semi-supervisée par des modèles d’apprentissage statistique adaptés au matériau linguistique.

Ces modèles permettent d’étudier le fonctionnement des langues, leurs variations (phonétiques-phonologiques, morphologiques-lexicales, syntaxiques et sémantiques) synchroniques et diachroniques, diaphasiques et diatopiques ainsi que de soulever des questions relatives à leur acquisition en tant que langues maternelles ou secondes. Enfin, le département développe les grandes applications du traitement des langues :reconnaissance vocale, traduction automatique, recherche d’information, agents conversationnels, qui portent des enjeux sociétaux (sauvegarde des langues en danger, outillage de personnes en situation de handicap, aide au traitement de l’information et de la connaissance médicale) et éthiques de plus en plus importants.

Cette approche de la Langue et des langues couvre ainsi un large spectre, des recherches les plus fondamentales aux plus appliquées, dans une grande variété de médias (journaux, médias sociaux, vidéo, téléphone) et toutes les modalités (écrit, parole et signe).

Ces recherches sont fortement pluridisciplinaires et rassemblent des communautés diverses relevant de l’informatique, des sciences de l’ingénieur et des sciences humaines et sociales, qui se retrouvent autour de l’étude de la langue par l’exploitation de corpus et la culture de l’évaluation quantitative, deux marqueurs forts de leur activité de recherche

Les équipes

Jusqu’en 2023, le département comptait deux équipes : ILES et TLP. Ces deux équipes se sont restructurées ainsi :

Langue Interaction Parole et Signes (LIPS), coordonnée par Ioana Vasilescu
Sémantique et Extraction d’information (SEME), coordonnée par Agata Savary
Modèles, Méthodes et Multilinguisme (M³), coordonnée par Albert Rilliard

Les pages de contenu sont en cours de rédaction.

Actualités

Distinction, IAIntelligence Artificielle, Sciences et Technologies des langues

Laurence Devillers élevée au grade de l'ordre national du Mérite
IAIntelligence Artificielle, Recrutement, Sciences des Données, Sciences et Technologies des langues

Campagne 2026 : 2 postes d'enseignants-chercheurs en IA au LISN
Colloque, Sciences et Technologies des langues

Workshop on "Crowdsourced Speech and Automatic Alignment: New Frontiers for Laboratory Phonology" – Call for Submissions
Presse, Sciences et Technologies des langues

Créer éthiquement des textes artificiels pour entraîner les intelligences artificielles du domaine biomédical
Sciences et Technologies des langues

EcAuTAL 2025, l’école d’automne en TAL du département STL
Colloque, Sciences et Technologies des langues

LT4All 2025 : Technologies de la langue pour tous

Toutes les actualités

Offres de stages

Offres de stages publiées sur le site du LISN

Publications récentes

Communication dans un congrès

Lucía Catalán, Kim Gerdes. On the difficulty of producing good linguistic lies. Atelier sur l’Analyse et la Recherche de Textes Scientifiques 2026 (ARTS), Jun 2026, Nantes, France. ⟨hal-05688347⟩

STL

Année de publication 2026

Disponible en libre accès

Publication HAL
Communication dans un congrès

Idrissa Mahamoudou Dicko, Nona Naderi. Synergizing Domain-Specific Masked Language Models and Instruction-Tuned LLMs for Chemical NER. Atelier IAIntelligence Artificielle et santé, Jun 2026, Arras, France. ⟨hal-05679910⟩

STL

Année de publication 2026

Disponible en libre accès

Publication HAL
Communication dans un congrès

Jose Felipe Espinosa Orjuela, Philippe Boula de Mareüil, Marc Evrard. Speech synthesis for Walloon, an under-resourced minority language. 13th edition of the Speech Synthesis Workshop, Aug 2025, Leeuwarden, Netherlands. pp.189-195, ⟨10.21437/SSW.2025-29⟩. ⟨hal-05682647⟩

STL

Année de publication 2025

Disponible en libre accès

Publication HAL
Communication dans un congrès

Benedictus Kent Rachmat, Thomas Gerald, Zheng Zhang, Cyril Grouin. QA Analysis in Medical and Legal Domains: A Survey of Data Augmentation in Low-Resource Settings. ACL 2025 – 63rd Annual Meeting of the Association for Computational Linguistics (Volume 4: Student Research Workshop), ACL, Jul 2025, Vienna, Austria. pp.1132-1144, ⟨10.18653/v1/2025.acl-srw.89⟩. ⟨hal-05683004⟩

AO, STL

Année de publication 2025

Disponible en libre accès

Publication HAL
Communication dans un congrès

Laura Ascone, Lucie Gianola, Julien Longhi, Laurène Renaut. La linguistique forensique pour l’analyse du discours : anticiper les risques, aider à la décision, répondre aux menaces. Colloque R2DIP, « Les notions de risques, société et sécurité dans les discours institutionnels et politiques », CY Cergy Paris Université, Dec 2017, Cergy, France. ⟨hal-05682141⟩

ILES, STL

Année de publication 2017

Publication HAL
Proceedings/Recueil des communications

Nina Khairova, Victoria Vysotska, Natalia Grabar, Thierry Hamon, Nina Rizun. Preface: computational linguistics workshop. Computational Linguistics Workshop at 9th International Conference on Computational Linguistics and Intelligent Systems, May 2025, Kharkiv, Ukraine. Vol-3976, 2025. ⟨hal-05682500⟩

STL

Année de publication 2025

Publication HAL
Autre publication scientifique

Théophile Lenoir, Ana Valdivia, Aurélie Bugeau, Anne-Laure Ligozat. Beyond the Energy Efficiency Directive. Observatory on the Environmental Footprint of AIArtificial Intelligence, 2026. ⟨hal-05680820⟩

STL

Année de publication 2026

Disponible en libre accès

Publication HAL
Communication dans un congrès

Iskandar Boucharenc, Eve Sauvage, Thomas Gerald, Julien Tourille, Sabrina Campano, et al.. Using Syntax for the Semantic Representation of Sentences. SLiDE 1st Workshop on Structured Linguistic Data and Evaluation at the 2026 Language Resources and Evaluation Conference (LREC 2026), May 2026, Palma de majorque, Spain. pp.169–179, ⟨10.63317/4gtinxarm3dd⟩. ⟨hal-05669816⟩

STL

Année de publication 2026

Disponible en libre accès

Publication HAL
Communication dans un congrès

Clément Morand, Aurélie Névéol, Anne-Laure Ligozat. The Rising Unsustainability of AIArtificial Intelligence Graphics Cards Production. LIMITS 2026: 12th Workshop on Computing within Limits, Jun 2026, Online, France. ⟨hal-05666542⟩

STL

Année de publication 2026

Disponible en libre accès

Publication HAL
Communication dans un congrès

Kim Gerdes. The Grammar Does the Work: Functional vs. Lexical Dependency Length Minimization Across Universal Dependencies. UDW 2026 – Ninth Workshop on Universal Dependencies, May 2026, Palma De MaJorque, Spain. pp.163-173, ⟨10.63317/4akqrtsv7i65⟩. ⟨hal-05676925⟩

STL

Année de publication 2026

Disponible en libre accès

Publication HAL
Communication dans un congrès

Iskandar Boucharenc, Sahar Ghannay, Christophe Servan, Laure Soulier, Sophie Rosset. Étude de l’adaptation des gros modèles de langues par retour visuel. Journée Visu, GdR IG-RV, Jun 2023, Orsay, France. ⟨hal-05670004⟩

STL

Année de publication 2023

Disponible en libre accès

Publication HAL
Communication dans un congrès

Emmett Strickland, Marc Evrard, Valentina Fedchenko. Transfer Learning for Creole TTS: A Pilot Study on Whether Substrate Phonologies or Lexifier Vocabularies Matter More. Towards Inclusivity and Equality: Language Resources and Technologies for Under-Resourced and Endangered Languages, SIGUL 2026 Joint Workshop with ELE, EURALI, and DCLRL, May 2026, Palma De Majorque, Spain. ⟨10.63317/5d5qjmokuvmc⟩. ⟨hal-05617449⟩

STL

Année de publication 2026

Disponible en libre accès

Publication HAL
Communication dans un congrès

Clémentine Bleuze, Bruno Guillaume, Aurélie Névéol, Karën Fort. Omniprésents et anthropomorphisés : analyse lexico-syntaxique des discours sur les LLM. TALN 2026 – 33e Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2026, Nantes, France. ⟨hal-05670834⟩

STL

Année de publication 2026

Disponible en libre accès

Publication HAL
Communication dans un congrès

Clémentine Bleuze, Karën Fort, Vincent P. Martin, Aurélie Névéol. Grands modèles de langue pour prédire la santé mentale : une revue exploratoire de la documentation des biais et de l’utilité clinique. TALN 2026 – 33e Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2026, Nantes, France. ⟨hal-05670826⟩

STL

Année de publication 2026

Disponible en libre accès

Publication HAL
Article dans une revue

Clément Morand, Aurélie Névéol, Rosy Tsopra, Anne-Isabelle Tropeano, Sophie de Chambine, et al.. Prospectively Evaluating the Environmental Impacts of Digital Health Applications : A Case Study and Recommendations. Journal of the American Medical Informatics Association, 2026, ⟨10.1093/jamia/ocag091⟩. ⟨hal-05628404⟩

STL

Année de publication 2026

Disponible en libre accès

Publication HAL
Communication dans un congrès

Thomas Gerald, Sahar Ghannay, Julie Lascar, Paul Lerner, Anne Vilnat. Can Multimodal LLMs Generate Pedagogical Questions?. LREC 2026, May 2026, Palma, Spain. ⟨10.63317/4z4gj3h8jmc7⟩. ⟨hal-05658326⟩

STL

Année de publication 2026

Disponible en libre accès

Publication HAL
Communication dans un congrès

Thierry Hamon. Description of the LISN system for extracting terms. DEfinition and Term Extraction CHallenge 2026 (DETECH 2026), Jun 2026, Zadar, Croatia. ⟨hal-05669893⟩

STL

Année de publication 2026

Disponible en libre accès

Publication HAL
Communication dans un congrès

Marie Schmit, Melvin Selim Atay, Khalid Belhajjame, Ulysse Le Clanche, Emmanuel Coquery, et al.. ShareFAIR-KG, a centralised knowledge base of scientific workflows. JOBIM 2026 – Journées Ouvertes en Biologie, Informatique et Mathématiques, Jun 2026, Strasbourg, France. ⟨hal-05666980⟩

BioInfo, STL

Année de publication 2026

Disponible en libre accès

Publication HAL
Pré-publication, Document de travail

Louis Estève, Marie-Catherine de Marneffe, Nurit Melnik, Agata Savary, Olha Kanishcheva. A survey of diversity quantification in natural language processing: The why, what, where and how. 2026. ⟨hal-05661565⟩

STL

Année de publication 2026

Disponible en libre accès

Publication HAL
Pré-publication, Document de travail

Alexandre Genadot, Nicolas Guilliot, Philippe Boula de Mareüil. Introduction to the book “Cartographier les Langues de Nouvelle-Aquitaine: entre Grammaire et Société”. 2026. ⟨hal-05662837⟩

STL

Année de publication 2026

Publication HAL
Communication dans un congrès

Agata Savary, Manon Scholivet, Carlos Ramisch, Takuya Nakamura, Eric Bilinski, et al.. PARSEME 2.0 Multilingual Corpus of Multiword Expressions. LREC 2026 – 15th biennial Language Resources and Evaluation Conference, ELRA Language Resources Association, May 2026, Palma De MaJorque, Spain. pp.4819-4834, ⟨10.63317/2iy5qf38yhay⟩. ⟨hal-05661505⟩

ILES, STL

Année de publication 2026

Disponible en libre accès

Publication HAL
Communication dans un congrès

Julie Halbout, Annelies Braffort, Michèle Gouiffès, Diandra Fabre, Julie Lascar. Learning to Spot Signs from Named Entities. A study on French Sign Language. LREC 2026 – 12th Workshop on the Representation and Processing of Sign Languages: Language in Motion, May 2026, Palma de Majorque, Spain. ⟨10.63317/26i8n4zuyzyx⟩. ⟨hal-05636077⟩

AMIArchitectures et modèles pour l'Interaction, STL

Année de publication 2026

Disponible en libre accès

Publication HAL
Communication dans un congrès

Damien Lacroux, Aurélie Bugeau, Anne-Laure Ligozat. The indirect rebound effects of AIArtificial Intelligence as undone science: philosophical reflection on two structural causes. Undone Computer Science, Mar 2026, Luxembourg, Luxembourg. ⟨hal-05624399⟩

STL

Année de publication 2026

Disponible en libre accès

Publication HAL
Communication dans un congrès

Benedictus Kent Rachmat, Thomas Gerald, Zheng Zhang, Cyril Grouin. Les données de calibration comptent-elles vraiment pour LoRA?. EvalLLM2026 : Atelier sur l’évaluation des modèles génératifs (LLM), le RAG et challenges, Jul 2026, Nantes (France), France. ⟨hal-05633638⟩

STL

Année de publication 2026

Disponible en libre accès

Publication HAL
Communication dans un congrès

Mathilde Aguiar, Pierre Zweigenbaum, Nona Naderi. Assessing the Difficulty of Inference Types in Natural Language Inference for Clinical Trials. The Fifteenth Language Resources and Evaluation Conference (LREC 2026), May 2026, Palma, France. pp.5290-5300, ⟨10.63317/359toazp33g8⟩. ⟨hal-05652719⟩

STL

Année de publication 2026

Publication HAL
Communication dans un congrès

Jenny Copara, Nona Naderi, Gilles Falquet, Douglas Teodoro. MeSH Concept Relevance and Knowledge Evolution: A Data-Driven Perspective. 12th International Conference on Information Management and Big Data. Communications in Computer and Information Science, Oct 2025, Lima (Pérou), Peru. pp.280-299, ⟨10.1007/978-3-032-20322-9_20⟩. ⟨hal-05625658⟩

STL

Année de publication 2025

Disponible en libre accès

Publication HAL
Communication dans un congrès

Clément Morand, Aina Rasoldier, Paul Gay. Not up to its critical perspective on digitalization: A Descriptive Analysis of How Sustainability is Approached in the ICT4S Conference. ICT4S, Jun 2026, Berne, France. ⟨hal-05615744⟩

STL

Année de publication 2026

Disponible en libre accès

Publication HAL
Communication dans un congrès

Fanny Ducel, Lucie Digoin-Caparros, Ibrahim Al Kotob, Shayan Ahmed Shariff, Binesh Arakkal Remesh, et al.. Les benchmarks sont une source de biais des LLM : MMLU, CommonSenseQA et MGSM au microscope. TALN 2026 – 33e Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2026, Nantes, France. ⟨hal-05618509⟩

STL

Année de publication 2026

Disponible en libre accès

Publication HAL
Communication dans un congrès

Louis Estève, Christophe Servan, Thomas Lavergne, Agata Savary. A Diversity Diet for a Healthier Model: A Case Study of French ModernBERT. 64th Annual Meeting of the Association for Computational Linguistics (ACL 2026), Jul 2026, San Diego, United States. ⟨hal-05599374⟩

STL

Année de publication 2026

Disponible en libre accès

Publication HAL
Thèse

Virgile Barthet. Extraction d’information et classification de textes cliniques pour la prédiction du risque de décès. Intelligence artificielle [cs.AIArtificial Intelligence]. Université Paris-Saclay, 2026. Français. ⟨NNT : 2026UPASG019⟩. ⟨tel-05599487⟩

STL

Année de publication 2026

Disponible en libre accès

Publication HAL

Toutes les publications

Les équipes

Equipes

Actualités

Offres de stages

Publications récentes

Lucía Catalán, Kim Gerdes. On the difficulty of producing good linguistic lies. Atelier sur l’Analyse et la Recherche de Textes Scientifiques 2026 (ARTS), Jun 2026, Nantes, France. ⟨hal-05688347⟩

Idrissa Mahamoudou Dicko, Nona Naderi. Synergizing Domain-Specific Masked Language Models and Instruction-Tuned LLMs for Chemical NER. Atelier IAIntelligence Artificielle et santé, Jun 2026, Arras, France. ⟨hal-05679910⟩

Jose Felipe Espinosa Orjuela, Philippe Boula de Mareüil, Marc Evrard. Speech synthesis for Walloon, an under-resourced minority language. 13th edition of the Speech Synthesis Workshop, Aug 2025, Leeuwarden, Netherlands. pp.189-195, ⟨10.21437/SSW.2025-29⟩. ⟨hal-05682647⟩

Théophile Lenoir, Ana Valdivia, Aurélie Bugeau, Anne-Laure Ligozat. Beyond the Energy Efficiency Directive. Observatory on the Environmental Footprint of AIArtificial Intelligence, 2026. ⟨hal-05680820⟩

Clément Morand, Aurélie Névéol, Anne-Laure Ligozat. The Rising Unsustainability of AIArtificial Intelligence Graphics Cards Production. LIMITS 2026: 12th Workshop on Computing within Limits, Jun 2026, Online, France. ⟨hal-05666542⟩

Kim Gerdes. The Grammar Does the Work: Functional vs. Lexical Dependency Length Minimization Across Universal Dependencies. UDW 2026 – Ninth Workshop on Universal Dependencies, May 2026, Palma De MaJorque, Spain. pp.163-173, ⟨10.63317/4akqrtsv7i65⟩. ⟨hal-05676925⟩

Iskandar Boucharenc, Sahar Ghannay, Christophe Servan, Laure Soulier, Sophie Rosset. Étude de l’adaptation des gros modèles de langues par retour visuel. Journée Visu, GdR IG-RV, Jun 2023, Orsay, France. ⟨hal-05670004⟩

Clémentine Bleuze, Bruno Guillaume, Aurélie Névéol, Karën Fort. Omniprésents et anthropomorphisés : analyse lexico-syntaxique des discours sur les LLM. TALN 2026 – 33e Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2026, Nantes, France. ⟨hal-05670834⟩

Thomas Gerald, Sahar Ghannay, Julie Lascar, Paul Lerner, Anne Vilnat. Can Multimodal LLMs Generate Pedagogical Questions?. LREC 2026, May 2026, Palma, Spain. ⟨10.63317/4z4gj3h8jmc7⟩. ⟨hal-05658326⟩

Thierry Hamon. Description of the LISN system for extracting terms. DEfinition and Term Extraction CHallenge 2026 (DETECH 2026), Jun 2026, Zadar, Croatia. ⟨hal-05669893⟩

Marie Schmit, Melvin Selim Atay, Khalid Belhajjame, Ulysse Le Clanche, Emmanuel Coquery, et al.. ShareFAIR-KG, a centralised knowledge base of scientific workflows. JOBIM 2026 – Journées Ouvertes en Biologie, Informatique et Mathématiques, Jun 2026, Strasbourg, France. ⟨hal-05666980⟩

Louis Estève, Marie-Catherine de Marneffe, Nurit Melnik, Agata Savary, Olha Kanishcheva. A survey of diversity quantification in natural language processing: The why, what, where and how. 2026. ⟨hal-05661565⟩

Alexandre Genadot, Nicolas Guilliot, Philippe Boula de Mareüil. Introduction to the book “Cartographier les Langues de Nouvelle-Aquitaine: entre Grammaire et Société”. 2026. ⟨hal-05662837⟩

Damien Lacroux, Aurélie Bugeau, Anne-Laure Ligozat. The indirect rebound effects of AIArtificial Intelligence as undone science: philosophical reflection on two structural causes. Undone Computer Science, Mar 2026, Luxembourg, Luxembourg. ⟨hal-05624399⟩

Benedictus Kent Rachmat, Thomas Gerald, Zheng Zhang, Cyril Grouin. Les données de calibration comptent-elles vraiment pour LoRA?. EvalLLM2026 : Atelier sur l’évaluation des modèles génératifs (LLM), le RAG et challenges, Jul 2026, Nantes (France), France. ⟨hal-05633638⟩

Clément Morand, Aina Rasoldier, Paul Gay. Not up to its critical perspective on digitalization: A Descriptive Analysis of How Sustainability is Approached in the ICT4S Conference. ICT4S, Jun 2026, Berne, France. ⟨hal-05615744⟩

Louis Estève, Christophe Servan, Thomas Lavergne, Agata Savary. A Diversity Diet for a Healthier Model: A Case Study of French ModernBERT. 64th Annual Meeting of the Association for Computational Linguistics (ACL 2026), Jul 2026, San Diego, United States. ⟨hal-05599374⟩

Virgile Barthet. Extraction d’information et classification de textes cliniques pour la prédiction du risque de décès. Intelligence artificielle [cs.AIArtificial Intelligence]. Université Paris-Saclay, 2026. Français. ⟨NNT : 2026UPASG019⟩. ⟨tel-05599487⟩