Apprentissage des représentations de l’électroencéphalogramme à l’aide de l’apprentissage profond

Thèse encadrée par Sylvain CHEVALLIER

Orateur : Bruno ARISTIMUNHA PINTO

Le décodage de l’électroencéphalographie (EEG) fait face à un nouveau défi : les méthodes d’apprentissage profond qui ont transformé la science nécessitent d’énormes quantités de données, alors que les études EEG ne recueillent généralement que quelques centaines à quelques milliers d’essais par sujet. Cette rareté des données, combinée à une grande variabilité inter-sujets et à un faible rapport signal à bruit, limite l’application des approches modernes d’apprentissage automatique. Cette thèse étudie les stratégies d’apprentissage de représentation pour répondre aux contraintes des données EEG, en proposant des méthodes pour réutiliser, créer et contraindre les représentations tout en établissant une infrastructure pour une évaluation reproductible et réplicable. Dans la première partie, nous nous sommes concentrés sur la réutilisation des représentations grâce à l’apprentissage par transfert entre tâches cognitives. Nous avons évalué si les caractéristiques apprises dans une tâche EEG donnée pouvaient améliorer le décodage dans une autre tâche pour mesurer la transférabilité. Pour cela, nous avons testé ces approches sur 11 tâches issues de deux ensembles de données comprenant 135 sujets. Nous avons constaté que le transfert est très asymétrique: certaines tâches constituent des sources efficaces pour plusieurs cibles, tandis que d’autres bénéficient de l’absence de pré-entraînement. La combinaison linéaire des répresentations a permis d’obtenir des gains de précision, et le regroupement hiérarchique des matrices de transfert a révélé que les tâches faisant appel à des processus cognitifs similaires se regroupent. Dans la deuxième partie, nous nous sommes concentrés sur la création de représentations à l’aide de la modélisation générative afin d’enrichir des ensembles de données limités. Nous avons entraîné des modèles de diffusion latente avec une nouvelle fonction de coût spectrale sur des données EEG du sommeil provenant de deux ensembles de données afin de générer des époques réalistes de 30 secondes. Cette fonction de coût renforce la fidélité dans le domaine fréquentiel tout en minimisant les différences entre les transformées de Fourier à court terme des signaux réels et synthétiques, et en préservant les oscillations physiologiquement pertinentes. % dans les bandes delta, thêta et alpha. Dans la troisième partie, nous avons abordé le défi de l’efficacité des paramètres en contraignant les représentations avec des a priori géométriques. Nous avons proposé l’approche Phase-SPDNet, qui combine la géométrie riemannienne sur la variété symétrique définie positive avec la reconstruction de l’espace de phase basée sur le théorème de Takens. %Cette approche enrichit les matrices de covariance spatiale avec une dynamique temporelle grâce à l’intégration d’un décalage temporel, permettant un décodage efficace avec un minimum d’électrodes. Évaluée sur six jeux de données d’imagerie motrice en utilisant seulement trois électrodes, Phase-SPDNet obtient les meilleurs performances de la littérature. Dans la quatrième partie, nous avons abordé la crise de reproductibilité dans le décodage EEG en développant une infrastructure de comparaison standardisée. Nous avons organisé une compétition à grande échelle sur plus de 3000 sujets avec six tâches cognitives, révélant que la généralisation inter-sujets reste nettement plus difficile que la généralisation inter-tâches.

Mots-clés : Apprentissage profond,électroencéphalographie,décodage, …

Lien vers ses publications

Lieu de l'événement Lieu de l'événement

Lieu de l'événement