STL

Sciences et Technologies des Langues

Coordination : Gilles ADDA

Le département Sciences et Technologies des Langues étudie des questions fondamentales relatives aux systèmes linguistiques par l’exploitation de larges corpus collectés, annoté et enrichis de manière non-supervisée ou semi-supervisée par des modèles d’apprentissage statistique adaptés au matériau linguistique.

Ces modèles permettent d’étudier le fonctionnement des langues, leurs variations (phonétiques-phonologiques, morphologiques-lexicales, syntaxiques et sémantiques) synchroniques et diachroniques, diaphasiques et diatopiques ainsi que de soulever des questions relatives à leur acquisition en tant que langues maternelles ou secondes. Enfin, le département développe les grandes applications du traitement des langues :reconnaissance vocale, traduction automatique, recherche d’information, agents conversationnels,. . . qui portent des enjeux sociétaux (sauvegarde des langues en danger, outillage de personnes en situation de handicap, aide au traitement de l’information et de la connaissance médicale) et éthiques de plus en plus importants.

Cette approche de la Langue et des langues couvre ainsi un large spectre, des recherches les plus fondamentales aux plus appliquées, dans une grande variété de médias (journaux, médias sociaux, vidéo, téléphone, . . .) et toutes les modalités (écrit, parole et signe).

Ces recherches sont fortement pluridisciplinaires et rassemblent des communautés diverses relevant de l’informatique, des sciences de l’ingénieur et des sciences humaines et sociales, qui se retrouvent autour de l’étude de la langue par l’exploitation de corpus et la culture de l’évaluation quantitative, deux marqueurs forts de leur activité de recherche

Equipes du département

Actualités

Publications récentes

  • Proceedings/Recueil des communications

    Caio Corro, Gaël Lejeune. Actes de la journée d'étude sur la robustesse des systemes de TAL. 2022. ⟨hal-03853541⟩

    TLP

    Année de publication 2022

    Disponible en libre accès

  • Communication dans un congrès

    Lisa Raithel, Philippe Thomas, Roland Roller, Oliver Sapina, Sebastian Möller, et al.. Cross-lingual Approaches for the Detection of Adverse Drug Reactions in German from a Patient's Perspective. 13th Conference on Language Resources and Evaluation, Jun 2022, Marseille, France. ⟨hal-03866409⟩

    ILES

    Année de publication 2022

    Disponible en libre accès

  • Article dans une revue

    Anne-Laure Ligozat, Aurélie Bugeau, Julien Lefèvre, Jacques Combaz. Comment évaluer les bénéfices nets des solutions d’IA pour l’environnement ?. Interstices, 2022. ⟨hal-03877383⟩

    ILES

    Année de publication 2022

  • Communication dans un congrès

    Boris Dauriac, Annelies Braffort, Élise Bertin-Lemée. Example-based Multilinear Sign Language Generation from a Hierarchical Representation. LREC 2022 7th International Workshop on Sign Language Translation and Avatar Technology: The Junction of the Visual and the Textual (SLTAT 2022), Jun 2022, Marseille, France. pp.21-28. ⟨hal-03738596⟩

    ILES

    Année de publication 2022

    Disponible en libre accès

  • Communication dans un congrès

    Katherine Yeh, Thomas Lavergne, Pierre Zweigenbaum. Decorate the Examples: A Simple Method of Prompt Design for Biomedical Relation Extraction. LREC 2022 – Language Resources and Evaluation Conference, Jun 2022, Marseille, France. pp.3780-3787. ⟨hal-03867421⟩

    ILES

    Année de publication 2022

    Disponible en libre accès

  • Communication dans un congrès

    Omar Adjali, Emmanuel Morin, Serge Sharoff, Reinhard Rapp, Pierre Zweigenbaum. Overview of the 2022 BUCC Shared Task: Bilingual Term Alignment in Comparable Specialized Corpora. BUCC, 15th Workshop on Building and Using Comparable Corpora, Jun 2022, Marseille, France. pp.67-76. ⟨hal-03867489⟩

    ILES

    Année de publication 2022

    Disponible en libre accès

  • Communication dans un congrès

    Ziqian Peng, Kim Gerdes, Kirian Guiller. Pull your treebank up by its own bootstraps. Journées Jointes des Groupements de Recherche Linguistique Informatique, Formelle et de Terrain (LIFT) et Traitement Automatique des Langues (TAL), Nov 2022, Marseille, France. pp.139-153. ⟨hal-03846834⟩

    TLP

    Année de publication 2022

    Disponible en libre accès

  • Communication dans un congrès

    You Zuo, Yixuan Li, Alma Parias García, Kim Gerdes. Technological taxonomies for hypernym and hyponym retrieval in patent texts. ToTh 2022 – Terminology & Ontology: Theories and applications, Jun 2022, Chambéry, France. ⟨hal-03850399⟩

    TLP

    Année de publication 2022

    Disponible en libre accès

  • Pré-publication, Document de travail

    Teven Le Scao, Angela Fan, Christopher Akiki, Ellie Pavlick, Suzana Ilić, et al.. BLOOM: A 176B-Parameter Open-Access Multilingual Language Model. 2022. ⟨hal-03850124⟩

    TLP

    Année de publication 2022

    Disponible en libre accès

  • Communication dans un congrès

    Annelies Braffort. Langue des Signes Française : Etat des lieux des ressources linguistiques et des traitements automatiques. Journées Jointes des Groupements de Recherche Linguistique Informatique, Formelle et de Terrain (LIFT) et Traitement Automatique des Langues (TAL), Nov 2022, Marseille, France. pp.131-138. ⟨hal-03846845⟩

    ILES

    Année de publication 2022

    Disponible en libre accès