Differences

This shows you the differences between two versions of the page.

--- realisation_env_grille_qlearning_sma_jsl [2025/04/19 22:03]
3.142.54.53 old revision restored (2024/09/14 01:18)
+++ realisation_env_grille_qlearning_sma_jsl [2025/05/13 06:42] (current)
3.148.108.24 old revision restored (2024/07/05 19:05)
@@ Line 1: / Line 1: @@
 ===== Environnement grille - Qlearning - Joint state learners =====
-==== Modifications apportées à la grille ====
-   * Les récompenses sont accordées aux agents après qu'ils aient tous effectués une action.
-   * Si des agents entrent en collision, ils ne se déplacent pas
-   * Possibilité de compter le nombre de collisions
-==== Expérience ====
 Même conditions que pour l'environnement grille classique avec des ILs. \\
@@ Line 13: / Line 5: @@
 Rappel des résultats obtenus avec des ILs : http://liris.cnrs.fr/sasem/doku.php?id=realisation_env_grille_qlearning_sma
 ==== Résultats avec Joint state learners ====
-Les collisions disparaissent rapidement (les deux courbes se confondent car les collisions qui arrivent a un agent arrivent forcément à l'autre):
+Les collisions disparaissent rapidement :
 {{:rewards_collisions_grille_jsl.png|}}

DokuWiki