Thèmes de recherche de l’équipe LAHDAK

L’objectif de l’équipe LaHDAK est de relever les défis liés aux données et aux connaissances massives.
Nous nous proposons de concevoir des solutions pour traiter des données complexes, structurées, sémantiquement hétérogènes, incertaines, manquantes et évolutives, provenant de toutes les sources, y compris les données du web social, les données ouvertes liées ou les données scientifiques. La pertinence sémantique, l’efficacité, l’évolutivité et la robustesse sont les principales questions étudiées. 

L’équipe LaHDAK réunit deux domaines d’expertise complémentaires, la gestion des données et l’intelligence artificielle. Ses activités de recherche sont organisées en plusieurs axes et chacun d’entre eux est structuré en plusieurs thèmes. Nous avons retenu trois axes principaux que nous décrivons dans ce qui suit. 

(i) Données massives et hétérogènes : stockage et intégration. L’équipe LaHDAK travaille sur l’extraction et l’intégration d’informations à partir de sources de données structurées et non structurées (telles que du texte et des images). L’équipe LaHDAK s’intéresse à l’indexation des données et à l’optimisation des requêtes dans le contexte des nouveaux systèmes d’intégration de données de type polystore, où les systèmes gérant les sources de données sont eux-mêmes hétérogènes, c’est-à-dire des bases de données relationnelles, des bases de données de graphes, des bases de données no-SQL, etc.

(ii) Les graphes de connaissances : raffinement et raisonnement. Nous nous intéressons au raffinement des graphes de connaissances, qui consiste à la fois à les enrichir et à détecter les connaissances incohérentes. L’équipe LaHDAK travaille d’une part sur l’extraction de modules sémantiques à partir de grandes ontologies en utilisant des techniques de raisonnement en IA symbolique.  D’autre part, l’équipe LaHDAK développe des méthodes pour la détection et l’invalidation des liens d’identité dans les données ouvertes liées. Différents algorithmes de découverte de règles ont également été développés au sein de l’équipe LaHDAK pour la mise en relation de données, l’explication de relations causales ou l’aide à la décision (par exemple, la détection de fraudes). 

(iii) Extraction et optimisation de graphes. Nous nous intéressons à l’apprentissage de modèles d’intégration de graphes utilisant l’apprentissage par renforcement pour la maximisation de l’influence dans les réseaux sociaux et la recommandation. Dans cet axe, l’équipe LaHDAK travaille sur l’interrogation et l’indexation de grands graphes de données incertaines.