Memory Bandits for decision making in dynamical environments. Application to network optimization
Réda Alami. Bandits à Mémoire pour la prise de décision en environnement dynamique. Application à l'optimisation des réseaux de télécommunications. Intelligence artificielle [cs.AI]. Université Paris-Saclay, 2021. Français. ⟨NNT : 2021UPASG063⟩. ⟨tel-03409485⟩