Méthodologie pour la conception et l’analyse de compétitions en apprentissage automatique.

Thèse sous la direction d'Isabelle Guyon

Orateur : Adrien PAVAO

Ajouter à mon calendrier

Résumé

Nous développons et étudions une méthodologie systématique et unifiée pour organiser et utiliser les compétitions scientifiques dans la recherche, en particulier dans le domaine de l’apprentissage automatique (intelligence artificielle basée sur les données).
De nos jours, les compétitions deviennent de plus en plus populaires en tant qu’outil pédagogique et comme moyen de repousser les limites de l’état de l’art en engageant des scientifiques de tous âges, à l’intérieur ou à l’extérieur du milieu universitaire.
On peut y voir une forme de science citoyenne. Cette forme de contribution communautaire à la science pourrait contribuer à la recherche reproductible et démocratiser l’intelligence artificielle.
Toutefois, si la distinction entre organisateurs et participants peut atténuer certains biais, il existe un risque que des biais dans la sélection des données, les métriques d’évaluation, et d’autres éléments de conception expérimentale compromettent l’intégrité des résultats et amplifient l’influence du hasard.
Dans les cas extrêmes, les résultats pourraient être inutiles, voire préjudiciables à la communauté scientifique et, en conséquence, à la société dans son ensemble.
Notre objectif est d’inscrire l’organisation de compétitions scientifiques dans un cadre rigoureux et d’offrir à la communauté des recommandations éclairées. Conjointement avec l’effort de développement des outils d’organisation de compétitions que nous développons dans le cadre du projet CodaLab, nous visons à fournir une contribution utile à la communauté
Cette thèse comprend des contributions théoriques s’appuyant sur la conception expérimentale, les statistiques et la théorie des jeux, ainsi que des résultats empiriques pratiques résultant de l’analyse des données de compétitions passées.

Composition du jury

Ioannis TSAMARDINOS – Professeur, University of Crete – Rapporteur & Examinateur
Mihaela VAN DER SCHAAR – Professeur, University of Cambridge – Rapporteur & Examinateur
Kristin BENNETT – Professeur, Rensselaer Polytechnic Institute – Examinateur
Magali RICHARD – Professeur, Université Grenoble Alpes – Examinateur
Bertrand THIRION – Chercheur, INRIA, Université Paris-Saclay – Examinateur
Isabelle GUYON – Professeur, Université Paris-Saclay – Directrice de thèse

Publications

Communication dans un congrès

Adrien Pavao, Michael Vaccaro, Isabelle Guyon. Judging competitions and benchmarks: a candidate election approach. ESANN 2021 – 29th European Symposium on Artificial Neural Networks, Oct 2021, Bruges/Virtual, Belgium. ⟨hal-03367857v3⟩

AO

Année de publication 2021

Disponible en libre accès

Publication HAL
Communication dans un congrès

Adrien Pavao, Isabelle Guyon, Nachar Stéphane, Fabrice Lebeau, Martin Ghienne, et al.. Aircraft Numerical “Twin”: A Time Series Regression Competition. ICMLA 2021 – 20th IEEE International Conference on Machine Learning and Applications., Dec 2021, Pasadena / Virtual, United States. ⟨10.1109/ICMLA52953.2021.00075⟩. ⟨hal-03463307v3⟩

AO

Année de publication 2021

Disponible en libre accès

Publication HAL
Communication dans un congrès

Adrien Pavao, Zhengying Liu, Isabelle Guyon. Filtering participants improves generalization in competitions and benchmarks. ESANN 2022 – European Symposium on Artificial Neural Networks, Oct 2022, Bruges, Belgium. ⟨hal-03869648⟩

AO

Année de publication 2022

Disponible en libre accès

Publication HAL
Article dans une revue

Zhen Xu, Sergio Escalera, Adrien Pavao, Magali Richard, Wei-Wei Tu, et al.. Codabench: Flexible, Easy-to-Use and Reproducible Meta-Benchmark Platform. Patterns, 2022, 3 (7), pp.100543. ⟨10.1016/j.patter.2022.100543⟩. ⟨hal-03374222v4⟩

AO

Année de publication 2022

Disponible en libre accès

Publication HAL
Rapport

Adrien Pavao, Isabelle Guyon, Anne-Catherine Letournel, Xavier Baró, Hugo Escalante, et al.. CodaLab Competitions: An open source platform to organize scientific challenges. [Technical Report] Université Paris-Saclay, FRA. 2022. ⟨hal-03629462⟩

AO, ASARD

Année de publication 2022

Disponible en libre accès

Publication HAL
Communication dans un congrès

Gaëtan Serré, Eva Boguslawski, Benjamin Donnot, Adrien Pavão, Isabelle Guyon, et al.. Reinforcement learning for Energies of the future and carbon neutrality: a Challenge Design. SSCI 2022 – IEEE Symposium Series on Computational Intelligence, IEEE, Dec 2022, Singapour, Singapore. ⟨hal-03726294v2⟩

AO

Année de publication 2022

Disponible en libre accès

Publication HAL
Article dans une revue

Zhengying Liu, Adrien Pavao, Zhen Xu, Sergio Escalera, Fabio Ferreira, et al.. Winning solutions and post-challenge analyses of the ChaLearn AutoDL challenge 2019. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2021, 43 (9), pp.3108 – 3125. ⟨10.1109/TPAMI.2021.3075372⟩. ⟨hal-02957135v5⟩

AO

Année de publication 2021

Disponible en libre accès

Publication HAL
Article dans une revue

Andrew Yale, Saloni Dash, Ritik Dutta, Isabelle Guyon, Adrien Pavao, et al.. Generation and Evaluation of Privacy Preserving Synthetic Health Data. Neurocomputing, 2020, 416, pp.244-255. ⟨10.1016/j.neucom.2019.12.136⟩. ⟨hal-03158544⟩

AO

Année de publication 2020

Disponible en libre accès

Publication HAL

Toutes les publications

Résumé

Composition du jury

Publications Lieu de l'événement

Adrien Pavao, Michael Vaccaro, Isabelle Guyon. Judging competitions and benchmarks: a candidate election approach. ESANN 2021 – 29th European Symposium on Artificial Neural Networks, Oct 2021, Bruges/Virtual, Belgium. ⟨hal-03367857v3⟩

Adrien Pavao, Zhengying Liu, Isabelle Guyon. Filtering participants improves generalization in competitions and benchmarks. ESANN 2022 – European Symposium on Artificial Neural Networks, Oct 2022, Bruges, Belgium. ⟨hal-03869648⟩

Zhen Xu, Sergio Escalera, Adrien Pavao, Magali Richard, Wei-Wei Tu, et al.. Codabench: Flexible, Easy-to-Use and Reproducible Meta-Benchmark Platform. Patterns, 2022, 3 (7), pp.100543. ⟨10.1016/j.patter.2022.100543⟩. ⟨hal-03374222v4⟩

Adrien Pavao, Isabelle Guyon, Anne-Catherine Letournel, Xavier Baró, Hugo Escalante, et al.. CodaLab Competitions: An open source platform to organize scientific challenges. [Technical Report] Université Paris-Saclay, FRA. 2022. ⟨hal-03629462⟩

Andrew Yale, Saloni Dash, Ritik Dutta, Isabelle Guyon, Adrien Pavao, et al.. Generation and Evaluation of Privacy Preserving Synthetic Health Data. Neurocomputing, 2020, 416, pp.244-255. ⟨10.1016/j.neucom.2019.12.136⟩. ⟨hal-03158544⟩

Lieu de l'événement Lieu de l'événement

Publications

Lieu de l'événement