Du

Horaire -

Lieu LISN Site Belvédère

IaH, Thèses et HDR

Systèmes de questions-réponses interactifs à grande échelle

Orateur : Oralie Cattan

Composition du jury :

– Catherine BERRUT (Professeure, Université de Grenoble – Alpes, LIG, Polytech – Grenoble) – Rapporteure & examinatrice

– Philippe MULLER (Maître de conférences, Université Paul Sabatier, IRIT) – Rapporteur & examinateur

– Emmanuel MORIN (Professeur, Université de Nantes, LS2N) – Examinateur

– Olivier FERRET (Chercheur, CEA List, LASTI) – Examinateur

– Laure SOULIER (Maîtresse de conférences, Sorbonne Université, ISIR) – Examinatrice

– Sophie Rosset (Directrice de recherche, LISN, CNRS) – Directrice de thèse

– Christophe Servan (Chercheur, Qwant, LISN) – Co-encadrant de thèse

La recherche d’informations a évolué avec notre besoin d’instantanéité et d’intuitivité en une forme d’interrogation en langue naturelle, non plus uniquement axée sur l’utilisation de mots clés. L’étude de ces interactions soulève des problématiques majeures relevant du champ de la compréhension en ce qui concerne la contextualisation des requêtes ou des questions. En effet, les questions sont rarement posées isolément. Regroupées, elles forment un dialogue qui se construit et se structure au fil de l’échange et et l’interaction.
Dans la série de questions suivantes : quel est le prix d’une chambre d’hôtel à Montréal ?, comment préparer un gâteau basque?, que faut-il savoir sur les abeilles noires ?, dorment-elles ?, l’interprétation de certaines questions dépend des questions et réponses précédemment posées.
Dans ce contexte, concevoir un système de réponse aux questions interactif capable de soutenir une conversation qui ne se résume pas à une simple succession de questions-réponses sporadiques constitue un défi en matière de modélisation et de calcul haute performance.
L’évolution des techniques et solutions de calculs intensifs, la disponibilité de grands volumes de données brutes (dans le cas de l’apprentissage non supervisé) ou enrichies avec des informations linguistiques ou sémantiques (dans le cas de l’apprentissage supervisé) ont permis aux méthodes d’apprentissage automatique de connaître des développement important, avec des applications considérables dans le milieu industriel. Malgré leurs succès, ces modèles, de domaine et de langue, appris à partir d’une quantité de données massive avec un nombre de paramètres important font émerger des questions d’utilisabilité et apparaissent aujourd’hui peu optimaux, compte tenu des nouveaux enjeux de sobriété numérique. Dans une entreprise réelle où les systèmes sont développés rapidement et devraient fonctionner de manière robuste pour une variété croissante de domaines, de tâches et de langues, un apprentissage rapide et efficace à partir d’un nombre limité d’exemples est indispensable.
Lors de cette soutenance nous approfondirons chacune des problématiques susmentionnées et présenterons des approches fondées sur l’apprentissage en quelques coups et par transfert issues de représentations latentes et contextuelles pour optimiser les performances et faciliter le déploiement à grande échelle.

Publications

Liste des publications d’oralie Cattan dans HAL : https://hal.universite-paris-saclay.fr/search/index/?q=oralie+cattan

Lieu de l'événement