Nous développons et étudions une méthodologie systématique et unifiée pour organiser et utiliser les compétitions scientifiques dans la recherche, en particulier dans le domaine de l’apprentissage automatique (intelligence artificielle basée sur les données). De nos jours, les compétitions deviennent de plus en plus populaires en tant qu’outil pédagogique et comme moyen de repousser les limites de l’état de l’art en engageant des scientifiques de tous âges, à l’intérieur ou à l’extérieur du milieu universitaire. On peut y voir une forme de science citoyenne. Cette forme de contribution communautaire à la science pourrait contribuer à la recherche reproductible et démocratiser l’intelligence artificielle. Toutefois, si la distinction entre organisateurs et participants peut atténuer certains biais, il existe un risque que des biais dans la sélection des données, les métriques d’évaluation, et d’autres éléments de conception expérimentale compromettent l’intégrité des résultats et amplifient l’influence du hasard. Dans les cas extrêmes, les résultats pourraient être inutiles, voire préjudiciables à la communauté scientifique et, en conséquence, à la société dans son ensemble. Notre objectif est d’inscrire l’organisation de compétitions scientifiques dans un cadre rigoureux et d’offrir à la communauté des recommandations éclairées. Conjointement avec l’effort de développement des outils d’organisation de compétitions que nous développons dans le cadre du projet CodaLab, nous visons à fournir une contribution utile à la communauté Cette thèse comprend des contributions théoriques s’appuyant sur la conception expérimentale, les statistiques et la théorie des jeux, ainsi que des résultats empiriques pratiques résultant de l’analyse des données de compétitions passées.
Composition du jury
Ioannis TSAMARDINOS – Professeur, University of Crete – Rapporteur & Examinateur
Mihaela VAN DER SCHAAR – Professeur, University of Cambridge – Rapporteur & Examinateur
Kristin BENNETT – Professeur, Rensselaer Polytechnic Institute – Examinateur
Magali RICHARD – Professeur, Université Grenoble Alpes – Examinateur
Isabelle GUYON – Professeur, Université Paris-Saclay – Directrice de thèse
Publications
Communication dans un congrès
Adrien Pavao, Michael Vaccaro, Isabelle Guyon. Judging competitions and benchmarks: a candidate election approach. ESANN 2021 – 29th European Symposium on Artificial Neural Networks, Oct 2021, Bruges/Virtual, Belgium. ⟨hal-03367857v3⟩
Adrien Pavao, Isabelle Guyon, Nachar Stéphane, Fabrice Lebeau, Martin Ghienne, et al.. Aircraft Numerical “Twin”: A Time Series Regression Competition. ICMLA 2021 – 20th IEEE International Conference on Machine Learning and Applications., Dec 2021, Pasadena / Virtual, United States. ⟨10.1109/ICMLA52953.2021.00075⟩. ⟨hal-03463307v3⟩
Adrien Pavao, Isabelle Guyon, Anne-Catherine Letournel, Xavier Baró, Hugo Escalante, et al.. CodaLab Competitions: An open source platform to organize scientific challenges. [Technical Report] Université Paris-Saclay, FRA. 2022. ⟨hal-03629462⟩
Gaëtan Serré, Eva Boguslawski, Benjamin Donnot, Adrien Pavão, Isabelle Guyon, et al.. Reinforcement learning for Energies of the future and carbon neutrality: a Challenge Design. SSCI 2022 – IEEE Symposium Series on Computational Intelligence, IEEE, Dec 2022, Singapour, Singapore. ⟨hal-03726294v2⟩