Sciences et Technologies des langues

EcAuTAL 2025, l’école d’automne en TAL du département STL

L’édition 2025 d’EcAuTAL, école d’automne en traitement automatique des langues (TAL), organisée par le département STL, se déroulera du 28 au 31 octobre 2025 au LISN.

Publié le

Pour qui ?

Le programme de cette école d’automne s’adresse essentiellement aux doctorants de première année (mais pas exclusivement) et vise à leur fournir les connaissances essentielles en TALTraitement Automatique des langues, apprentissage statistique et réseaux de neurones, ainsi que les bases méthodologiques (rédaction d’articles, utilisation de clusters et parallélisation) pour bien démarrer leur thèse.

Equipe pédagogique

Membres du département Sciences et Technologies des Langues (STL) du LISN : Aurélie NÉVÉOL (DR CNRS), Christophe SERVAN, Cyril GROUIN (IR CNRS), Manon SCHOLIVET (chercheuse post-doctorale), Marc EVRARD (MCF UPSaclay), Nona NADERI (CPJ UPSaclay), Patrick PAROUBEK (IR CNRS), Sahar GHANNAY (MCF UPSaclay), Salah YAHIAOUI (chercheur post-doctoral), Thomas GERALD (MCF UPSaclay), Thomas LAVERGNE (MCF UPSaclay)

Programme

  • Méthodologie scientifique. Pour bien mener sa recherche scientifique
    • Mardi 28 octobre, 14h-17h (Manon SCHOLIVET) : méthodologie scientifique. Définition d’une question de recherche (1h30), lecture critique d’article scientifique (1h30)
    • Jeudi 30 octobre, 13h30-16h30 (Marc EVRARD) : traitement de la parole. Les bases du traitement de la parole
  • Bases du TALTraitement Automatique des langues. Comprendre pourquoi certaines tâches de base sont essentielles
    • Mardi 28 octobre, 10h-11h (Thomas LAVERGNE) : encodages de caractères. Quels sont les encodages, les problèmes posés, comment on les traite ; apprendre à reconnaître le problème ; apprendre à le régler
    • Vendredi 31 octobre, 13h-16h (Patrick PAROUBEK) : annotation de corpus. Articulation entre : tâche de TALTraitement Automatique des langues, corpus (documents) et modèles d’annotation
  • Modèles de langue. Pour ne pas perdre de temps
    • Mardi 28 octobre, 11h-13h (Thomas GERALD) : tokenisation BPE. Présentation de l’algorithme de tokenisation BPE
    • Mercredi 29 octobre, 10h-12h (Nona NADERI) : evaluation and benchmarking (this lecture will be given in English). Language model evaluation and benchmarking
    • Mercredi 29 octobre, 13h-17h (Christophe SERVAN) : DL4NLP. Utilisation du Deep Learning pour le TALTraitement Automatique des langues
    • Jeudi 30 octobre, 10h-12h (Thomas GERALD) : adaptation des modèles de langue. Affinage, bibliothèque pour l’entraînement des LLM
    • Vendredi 31 octobre, 10h-12h (Salah YAHIAOUI) : inférences et prompt-engineering. Apprendre à faire des prompts efficaces

Informations pratiques :

  • Inscriptions : sur le portail ADUM
  • Site web EcAuTAL : lien

Contact

  • Sciences et Technologies des Langues

    SEME

    Grouin Cyril

Lieu de l'événement