Du

Horaire -

Lieu LISN Site Plaine

Science des Données, Thèses et HDR

Découverte de règles expressives pour le raffinement de graphes de connaissances

Soutenance jeudi 13 juillet à 9h30 en salle 435 au LISN, bâtiment 650. https://cnrs.zoom.us/j/95042504893?pwd=alRYazdYTTFCQTB1aUJwUGRIOWpqdz09#success

Orateur : Armita KHAJEH NASSIRI

Lien Zoom : https://cnrs.zoom.us/j/95042504893?pwd=alRYazdYTTFCQTB1aUJwUGRIOWpqdz09#success

Composition du jury

  • Jérôme DAVID, Maître de conférences, INRIAGrenoble & Université de Grenoble. Rapporteur & Examinateur
  • Arnaud SOULET, Maître de conférences, Université de Tours. Rapporteur & Examinateur
  • Sylvain CHEVALLIER, Professeur, Université Paris Saclay. Examinateur
  • Luis GALLARAGA, Chargé de recherche, INRIA Rennes. Examinateur
  • Hala SKAF MOLLI, Professeure, Université de Nantes. Examinatrice
  • Maguelonne TEISSEIRE, Directrice de recherche, INRAE Montpellier. Examinatrice
  • Fatiha SAÏS, Professeure, Université Paris Saclay, Directrice de thèse
  • Nathalie PERNELLE, Professeure, Université Sorbonne Paris-Nord, Co-encadrante

Résumé

Les graphes de connaissances (KG) sont des structures de graphes hétérogènes représentant des faits dans un format lisible par une machine. Ils trouvent des applications dans des tâches telles que la réponse automatique aux questions, la désambiguïsation et liaison d’entités. Cependant, les graphes de connaissances sont intrinsèquement incomplets et il est essentiel de les raffiner pour améliorer leur qualité.

Pour compléter le graphe de connaissances, il est possible de prédire les liens manquants dans un graphe de connaissances ou d’intégrer des sources externes. En extrayant des règles du graphe de connaissances, nous pouvons les exploiter pour compléter le graphe tout en fournissant des explications. Plusieurs approches ont été proposées pour extraire efficacement des règles. Or, la littérature manque de méthodes efficaces pour incorporer des prédicats numériques dans les règles. Pour répondre à cette lacune, nous proposons REGNUM, qui permet d’extraire des règles numériques avec des contraintes d’intervalle. REGNUM s’appuie sur les règles générées par un système d’extraction de règles existant et les enrichit en incorporant des prédicats numériques guidés par des mesures de qualité. En outre, la nature interconnectée des données web offre un potentiel significatif pour compléter et raffiner les KG, par exemple, par le liage des données, qui consiste à trouver des liens d’identité entre des entités de KG différents. Nous présentons RE-miner, une approche qui extrait des expressions référentielles (RE) pour une classe dans un graphe de connaissances.

Les REs sont des règles qui ne s’appliquent qu’à une seule entité. Elles facilitent la découverte de connaissances et permettent de lier les données de manière explicable. De plus, nous visons à explorer les avantages et les opportunités de l’affinage des modèles linguistiques pour combler le fossé entre les KG et les données textuelles. Nous présentons GilBERT, qui exploite le fine-tuning sur des modèles linguistiques tels que BERT en optimisant une fonction de coût par triplet pour les tâches de prédiction de relation et de classification de triple. En prenant en compte ces défis et en proposant des approches novatrices, cette thèse contribue au raffinement des KG, en mettant particulièrement l’accent sur l’explicabilité et la découverte de connaissances. Les résultats de cette recherche ouvrent la voie à de nouvelles questions de recherche qui font progresser vers des KG de meilleure qualité.

Lieu de l'événement