Lien vers le github : https:github.com/openai/gym/wiki/Pendulum-v0 Le pendule est sur 3 dimensions continues. L'action à renvoyer est aussi continue. La Qtable serait d'environ 21 * 21 * 161 = 70 000 états en arrondissant les 3 dimensions à 1 décimal. Sans compter les 21 actions possibles en discrétisant de la même manière. ( environ 1 470 000 états-actions). Je ne suis pas sur de pouvoir faire converger ca un jour :-| J'essaie pour le moment de faire marcher le Mountain Car qui me parait plus abordable.