
Directrice de Recherche
Responsable du département STL
Membre de la Cellule Science Responsable (axe Développement Durable)
Le Laboratoire Interdisciplinaire des Sciences du Numérique (LISN – UMRUnité Mixte de Recherche CNRS 9015, INRIA, Centrale Supélec) a été créé en 2021 en regroupant 16 équipes de recherche du LIMSILaboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur, créé en 1972 et dont les équipes ont rejoint celles du LRI en 2021 pour fonder le LISN. et du LRI (structurées en 5 départements), et leurs services de soutien et support à la recherche, comprenant ainsi plus de 350 personnes.
Le LISN est le laboratoire de l’université Paris-Saclay avec la plus importante expertise en intelligence artificielle : il comporte plus de 170 membres travaillant dans ce domaine, dont plus de 60 permanents, principalement dans les départements Science des Données (SD) et Sciences et Technologies des Langues (STL).
Le LISN bénéficie d’un environnement porteur (cluster DataIA, programme PhDs COFUND DeMythif.AI, masters en IA très sélectifs et ouverts à l’international). Les personnes recrutées pourront compter sur le soutien financier de DataIA pour la mise en place de leurs projets à Paris-Saclay ainsi que celui du programme Springboard de l’université (120k€ potentiellement).
Fort de cette dynamique, le LISN recrute cette année un·e Professeur·e et un· Maître·sse de conférence en IA, dans le cadre d’une programmation pluri-annuelle portant sur une dizaine de postes, avec un service d’enseignement à l’UFR Sciences de l’université Paris-Saclay.
Les candidat·es cette année intégreront les équipes A&O, Bioinfo ou LaHDAK du département SD, ou les équipes LIPSLangue Interaction Parole et Signes, M3 ou SEME du département STL. La priorité pour le poste MdC sera donnée à l’équipe A&O.
La personne recrutée s’impliquera dans l’animation scientifique du laboratoire. La personne recrutée pour le poste de Professeur·e s’engagera à prendre des responsabilités dans la branche IA du master informatique de l’université. Un rayonnement international sera apprécié. Les candidat·es sont invités à contacter les responsables des départements et équipes qu’ils ou elles souhaitent s’intégrer, à savoir :
Le département Sciences et Technologies des Langues (STL) souhaite renforcer les activités orientées vers le développement de modèles et méthodes d’IA pour contribuer à la découverte de propriétés fondamentales de la langue, et à l’analyse efficace d’énoncés écrits oraux ou signés.
Le département STL rassemble 3 équipes (LIPSLangue Interaction Parole et Signes, M3, SEME) de renommée internationale développant des méthodes d’IA aussi bien statistique que symbolique, avec un regard pluridisciplinaire alliant informatique, traitement du signal et linguistique. Le département étudie des questions fondamentales relatives aux systèmes linguistiques, en exploitant de larges corpus collectés, annotés et enrichis de manière non-supervisée ou semi-supervisée. Ainsi, nous développons les grandes applications du traitement des langues (reconnaissance vocale, recherche d’information, agents conversationnels, …) qui portent des enjeux sociétaux et éthiques de plus en plus importants. Le département s’intéresse aux problématiques d’accès au sens contenu dans les productions langagières, dans un objectif d’analyse, de compréhension, de modélisation, ou de production. Nous appliquons nos recherches aux modalités écrites, parlées et signées ainsi que dans une diversité de registres et de domaines de spécialité, comme le domaine biomédical.
La personne recrutée devra présenter un projet de recherche en Traitement Automatique des Langues et un projet d’intégration dans les thématiques intéressant le département en priorité autour de l’étude des grands modèles de langues (LLM), comme par exemple :
Directrice de Recherche
Responsable du département STL
Membre de la Cellule Science Responsable (axe Développement Durable)
Le département Science des Données (SD) regroupe quatre équipes aux expertises reconnues et complémentaires (A&O, Bioinfo, LaHDAK, ROCS). Elles couvrent l’ensemble des étapes relatives à l’exploration des données et des connaissances, depuis leur modélisation jusqu’à leur collecte, leur gestion, leur analyse, leur structuration et leur exploitation par des méthodes d’apprentissage automatique. Cette complémentarité favorise des synergies autour des thématiques liées aux données, aux connaissances, à l’apprentissage statistique et à l’optimisation, avec des applications marquées dans les domaines de la simulation, de la bio-informatique et du web.
Au-delà des fondements théoriques et méthodologies des sciences des données, le département affirme une forte dimension applicative en contribuant à des enjeux sociétaux majeurs tels que la santé, la transition écologique, les sciences du vivant et les infrastructures numériques. Cet ancrage dans les applications s’accompagne d’une vigilance éthique sur les choix de recherche, avec la volonté de développer des méthodes sobres, explicables et inclusives, attentives aux biais et à leurs impacts. Le département se distingue également par un engagement affirmé en faveur d’une recherche ouverte et reproductible, favorisant la transparence, le partage des savoirs et la diffusion citoyenne des résultats scientifiques.
Les thématiques IA du département comprennent:
Cette liste est non exhaustive, de nouvelles thématiques sont les bienvenues.
Chercheur
Responsable du département Science des données
L’équipe souhaite renforcer les travaux autour de l’impact des grands modèles de langues (LLM), sur les thématiques suivantes :
Chercheur CNRS
Responsable de l'équipe M3
L’équipe souhaite renforcer les travaux en priorité autour de la problématique de l’extraction d’information :
Ingénieur de recherche HDR
Responsable de l'équipe SEME
Co-responsable de la Commission Locaux
Professeur
Responsable de l'équipe A&O
Responsable de l'équipe LaHDAK au LISN
Co-responsable de la mention Master Informatique, Univ. Paris Saclay
Cette thématique vient renforcer la collaboration déjà existante entre les équipes BioInfo et AO. Il s’agit de développer des approches d’apprentissage statistique pour des applications en biologie, par exemple en génétique des populations, évolution, ou encore pour l’intégration de données biologiques et de santé. Liste non exhaustive: génomique, évolution et écologie génétique, motifs et structuration de séquences biologiques, évolution du génome, toute application à des données biologiques, biomédicales, ou meta (base de données de pipelines bioinformatiques).
Impact, Position
La potentialité de l’apprentissage, entre autre de l’apprentissage profond (reseaux de neurones), pour la bio-informatique a été démontrée médiatiquement par Alpha-Fold(2) sur le sujet du repliement de protéines (sujet important dans le design de médicaments et dans la compréhension des mécanismes cellulaires). La robustesse, interprétabilité et transférabilité de ces approches sont donc activement analysées par les experts du domaine. Plus généralement, les méthodes d’apprentissage sont flexibles et permettent de tirer profit des données disponibles tout en intégrant les connaissances du domaine. L’apprentissage profond, par exemple, peut exploiter les propriétés structurelles des données, comme les invariances par translation/permutation ou leur structure en graphe. Pour ce faire, il faut à la fois une expertise dans le domaine d’application pour exprimer les propriétés et connaissances à integrer au modèle, et un savoir-faire pour concevoir les méthodes adaptées.
Axes
Les objets d’études privilégiés de l’équipe Bioinfo sont les séquences génomiques, ARN, proteines et les bases de données d’objets et de méthodes bioinformatiques (pipelines), avec un intérêt fort pour les questions évolutives et biomédicales. Pour tous ces objets, les axes méthodologiques visés par cette offre sont les suivants (non exhaustif).
Chercheuse
Responsable adjointe de l'équipe BioInfo
Enseignante-chercheuse
Membre de la Cellule Science Responsable (axe Développement Durable)
Les deux dernières étant déjà décrites ci-dessus dans les thématiques des équipes, voici la description de la troisième:
L’objectif d’adapter les connaissances et les pratiques humaines au changement climatique définit un programme de recherche ambitieux en Intelligence Artificielle, mobilisant les efforts joints de toutes les disciplines liées à la science des données (en particulier, apprentissage, représentation des connaissances, raisonnement (distribué), explications, préférences, algorithmique, capteurs).
Un exemple d’application est celui de l’agro-écologie, où deux axes se dessinent (de manière non exclusive) : i) la recherche de stratégies d’adaptation, réutilisant l’état de l’art et des pratiques des régions passées, pour identifier un éventail de solutions adaptées à une région en évolution. Les approches envisagées demandent d’allier les connaissances disponibles aux diverses échelles (depuis la biologie jusqu’à la typologie des terrains) en exploitant les essais ponctuels dans une logique de système de recommandation. ii) la prise en compte des incertitudes portant sur la nature de l’évolution, requérant de passer d’un problème d’optimisation à un problème d’optimisation multi-objectifs.
La personne recrutée s’intégrera dans un écosystème dynamique et stimulant incluant : DATAIA, ClusterIA, IRT System X, SATT Paris Saclay et de nombreux partenaires industriels.