Du

Horaire -

Lieu LISN Site Plaine

AAC, Science des Données, Thèses et HDR

Méthodologie pour la conception et l’analyse de compétitions en apprentissage automatique.

Thèse sous la direction d'Isabelle Guyon

Orateur : Adrien PAVAO

Résumé

Nous développons et étudions une méthodologie systématique et unifiée pour organiser et utiliser les compétitions scientifiques dans la recherche, en particulier dans le domaine de l’apprentissage automatique (intelligence artificielle basée sur les données).
De nos jours, les compétitions deviennent de plus en plus populaires en tant qu’outil pédagogique et comme moyen de repousser les limites de l’état de l’art en engageant des scientifiques de tous âges, à l’intérieur ou à l’extérieur du milieu universitaire.
On peut y voir une forme de science citoyenne. Cette forme de contribution communautaire à la science pourrait contribuer à la recherche reproductible et démocratiser l’intelligence artificielle.
Toutefois, si la distinction entre organisateurs et participants peut atténuer certains biais, il existe un risque que des biais dans la sélection des données, les métriques d’évaluation, et d’autres éléments de conception expérimentale compromettent l’intégrité des résultats et amplifient l’influence du hasard.
Dans les cas extrêmes, les résultats pourraient être inutiles, voire préjudiciables à la communauté scientifique et, en conséquence, à la société dans son ensemble.
Notre objectif est d’inscrire l’organisation de compétitions scientifiques dans un cadre rigoureux et d’offrir à la communauté des recommandations éclairées. Conjointement avec l’effort de développement des outils d’organisation de compétitions que nous développons dans le cadre du projet CodaLab, nous visons à fournir une contribution utile à la communauté
Cette thèse comprend des contributions théoriques s’appuyant sur la conception expérimentale, les statistiques et la théorie des jeux, ainsi que des résultats empiriques pratiques résultant de l’analyse des données de compétitions passées.

Composition du jury

  • Ioannis TSAMARDINOS – Professeur, University of Crete – Rapporteur & Examinateur
  • Mihaela VAN DER SCHAAR – Professeur, University of Cambridge – Rapporteur & Examinateur
  • Kristin BENNETT – Professeur, Rensselaer Polytechnic Institute – Examinateur
  • Magali RICHARD – Professeur, Université Grenoble Alpes – Examinateur
  • Bertrand THIRION – Chercheur, INRIA, Université Paris-Saclay – Examinateur
  • Isabelle GUYON – Professeur, Université Paris-Saclay – Directrice de thèse

Publications

  • Communication dans un congrès

    Adrien Pavao, Michael Vaccaro, Isabelle Guyon. Judging competitions and benchmarks: a candidate election approach. ESANN 2021 – 29th European Symposium on Artificial Neural Networks, Oct 2021, Bruges/Virtual, Belgium. ⟨hal-03367857v3⟩

    AO

    Année de publication

    Disponible en libre accès

  • Communication dans un congrès

    Adrien Pavao, Isabelle Guyon, Nachar Stéphane, Fabrice Lebeau, Martin Ghienne, et al.. Aircraft Numerical “Twin”: A Time Series Regression Competition. ICMLA 2021 – 20th IEEE International Conference on Machine Learning and Applications., Dec 2021, Pasadena / Virtual, United States. ⟨10.1109/ICMLA52953.2021.00075⟩. ⟨hal-03463307v3⟩

    AO

    Année de publication

    Disponible en libre accès

  • Communication dans un congrès

    Adrien Pavao, Zhengying Liu, Isabelle Guyon. Filtering participants improves generalization in competitions and benchmarks. ESANN 2022 – European Symposium on Artificial Neural Networks, Oct 2022, Bruges, Belgium. ⟨hal-03869648⟩

    AO

    Année de publication

    Disponible en libre accès

  • Article dans une revue

    Zhen Xu, Sergio Escalera, Adrien Pavao, Magali Richard, Wei-Wei Tu, et al.. Codabench: Flexible, Easy-to-Use and Reproducible Meta-Benchmark Platform. Patterns, 2022, 3 (7), pp.100543. ⟨10.1016/j.patter.2022.100543⟩. ⟨hal-03374222v4⟩

    AO

    Année de publication

    Disponible en libre accès

  • Rapport

    Adrien Pavao, Isabelle Guyon, Anne-Catherine Letournel, Xavier Baró, Hugo Escalante, et al.. CodaLab Competitions: An open source platform to organize scientific challenges. [Technical Report] Université Paris-Saclay, FRA. 2022. ⟨hal-03629462⟩

    AO, ASARD

    Année de publication

    Disponible en libre accès

  • Communication dans un congrès

    Gaëtan Serré, Eva Boguslawski, Benjamin Donnot, Adrien Pavão, Isabelle Guyon, et al.. Reinforcement learning for Energies of the future and carbon neutrality: a Challenge Design. SSCI 2022 – IEEE Symposium Series on Computational Intelligence, IEEE, Dec 2022, Singapour, Singapore. ⟨hal-03726294v2⟩

    AO

    Année de publication

    Disponible en libre accès

  • Article dans une revue

    Zhengying Liu, Adrien Pavao, Zhen Xu, Sergio Escalera, Fabio Ferreira, et al.. Winning solutions and post-challenge analyses of the ChaLearn AutoDL challenge 2019. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2021, ⟨10.1109/TPAMI.2021.3075372⟩. ⟨hal-02957135v5⟩

    AO

    Année de publication

    Disponible en libre accès

  • Article dans une revue

    Andrew Yale, Saloni Dash, Ritik Dutta, Isabelle Guyon, Adrien Pavao, et al.. Generation and Evaluation of Privacy Preserving Synthetic Health Data. Neurocomputing, 2020, 416, pp.244-255. ⟨10.1016/j.neucom.2019.12.136⟩. ⟨hal-03158544⟩

    AO

    Année de publication

    Disponible en libre accès

Lieu de l'événement