Differences

This shows you the differences between two versions of the page.

--- realisation_env_grille_qlearning_sma_jsl [2025/08/27 18:48]
66.249.68.68 old revision restored (2025/08/16 22:56)
+++ realisation_env_grille_qlearning_sma_jsl [2025/09/13 11:02] (current)
20.171.207.252 old revision restored (2025/08/30 05:12)
@@ Line 1: / Line 1: @@
 ===== Environnement grille - Qlearning - Joint state learners =====
+==== Modifications apportées à la grille ====
+   * Les récompenses sont accordées aux agents après qu'ils aient tous effectués une action.
+   * Si des agents entrent en collision, ils ne se déplacent pas
+   * Possibilité de compter le nombre de collisions
+==== Expérience ====
 Même conditions que pour l'environnement grille classique avec des ILs. \\
@@ Line 5: / Line 13: @@
 Rappel des résultats obtenus avec des ILs : http://liris.cnrs.fr/sasem/doku.php?id=realisation_env_grille_qlearning_sma
 ==== Résultats avec Joint state learners ====
-Les collisions disparaissent rapidement :
+Les collisions disparaissent rapidement (les deux courbes se confondent car les collisions qui arrivent a un agent arrivent forcément à l'autre):
 {{:rewards_collisions_grille_jsl.png|}}

DokuWiki