This is an old revision of the document!
Stage M1R 2017
Pointeurs
RL
Multi-Agent RL :
en premier, lire le chapitre 4 de https://tel.archives-ouvertes.fr/file/index/docid/362529/filename/these_matignon.pdf
puis lire http://liris.cnrs.fr/laetitia.matignon/index/matignon2012KER.pdf
Construction de représentations en RL
-
Combinaison de growing neural gaz GNG et Q-Learning pour discrétisation adaptative de l'espace d'états: http:
liris.cnrs.fr/sasem/lib/exe/fetch.php?media=m1r2017:vieira2013tdgngoriginal.pdf
* Self-Organizing Distinctive-State Abstraction (SODA) [Kuipers,2006]
=== App Constructiviste ===
* Thèse S. Mazac: https://tel.archives-ouvertes.fr/tel-01310583/file/TH2015MazacSebastien.pdf
=== RL et Inspirations Constructivistes ===
* Intrinsically Motivated RL [Singh2005] https://web.eecs.umich.edu/~baveja/Papers/FinalNIPSIMRL.pdf
===== Mémentos =====
A lire :
* https:ai.vub.ac.be/ALA2012/downloads/paper4.pdf
-