Contexte
Dans le cadre de recherches en traitement automatique des langues (TALTraitement Automatique des langues) portant sur les propositions atomiques (des unités sémantiques minimales extraites automatiquement de textes), nous proposons un mini-projet étudiant d’annotation multilingue et d’approfondissement thématique.
Description du projet
- Volet annotation : Après une présentation du sujet de recherche et de l’interface d’annotation, les participant(e)s contribueront à l’annotation de données en anglais, français, espagnol, allemand, italien et/ou portugais (selon les compétences linguistiques).
- Volet projet. Un approfondissement personnel au choix :
- Apprentissage automatique : fine-tuning de modèles de langue (PyTorch, Transformers)
- Logique formelle : sémantique computationnelle, théorie de l’information (Carnap–Bar-Hillel)
Modalités
Durée minimum 2 semaines, démarrage flexible, sur site au bâtiment 507 du LISN (Orsay).
- Immersion dans un laboratoire de recherche public (CNRS / Université Paris-Saclay)
- Expérience valorisable sur CV : participation à un projet de recherche actif
- Encadrement personnalisé et initiation aux pratiques de la recherche en TALTraitement Automatique des langues
Profil recherché
étudiant.e de L3, motivé.e, avec un intérêt pour le TALTraitement Automatique des langues, la linguistique computationnelle ou la logique. Aucun prérequis technique avancé n’est nécessaire.