Hotfix release available: 2025-05-14b "Librarian". upgrade now! [56.2] (what's this?)
Hotfix release available: 2025-05-14a "Librarian". upgrade now! [56.1] (what's this?)
New release available: 2025-05-14 "Librarian". upgrade now! [56] (what's this?)
Hotfix release available: 2024-02-06b "Kaos". upgrade now! [55.2] (what's this?)
Hotfix release available: 2024-02-06a "Kaos". upgrade now! [55.1] (what's this?)
New release available: 2024-02-06 "Kaos". upgrade now! [55] (what's this?)
Hotfix release available: 2023-04-04b "Jack Jackrum". upgrade now! [54.2] (what's this?)
Hotfix release available: 2023-04-04a "Jack Jackrum". upgrade now! [54.1] (what's this?)
New release available: 2023-04-04 "Jack Jackrum". upgrade now! [54] (what's this?)
Hotfix release available: 2022-07-31b "Igor". upgrade now! [53.1] (what's this?)
Hotfix release available: 2022-07-31a "Igor". upgrade now! [53] (what's this?)
New release available: 2022-07-31 "Igor". upgrade now! [52.2] (what's this?)
New release candidate 2 available: rc2022-06-26 "Igor". upgrade now! [52.1] (what's this?)
New release candidate available: 2022-06-26 "Igor". upgrade now! [52] (what's this?)
Hotfix release available: 2020-07-29a "Hogfather". upgrade now! [51.4] (what's this?)
realisation_env_grille_qlearning_sma_jsl

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
realisation_env_grille_qlearning_sma_jsl [2025/08/30 04:18]
66.249.68.67 old revision restored (2025/08/18 17:20)
realisation_env_grille_qlearning_sma_jsl [2025/09/13 11:02] (current)
20.171.207.252 old revision restored (2025/08/30 05:12)
Line 1: Line 1:
 ===== Environnement grille - Qlearning - Joint state learners ===== ===== Environnement grille - Qlearning - Joint state learners =====
 +
 +==== Modifications apportées à la grille ====
 +
 +   * Les récompenses sont accordées aux agents après qu'ils aient tous effectués une action.
 +   * Si des agents entrent en collision, ils ne se déplacent pas
 +   * Possibilité de compter le nombre de collisions
 +
 +==== Expérience ====
  
 Même conditions que pour l'environnement grille classique avec des ILs. \\ Même conditions que pour l'environnement grille classique avec des ILs. \\
Line 5: Line 13:
  
 Rappel des résultats obtenus avec des ILs : http://liris.cnrs.fr/sasem/doku.php?id=realisation_env_grille_qlearning_sma Rappel des résultats obtenus avec des ILs : http://liris.cnrs.fr/sasem/doku.php?id=realisation_env_grille_qlearning_sma
 +
  
 ==== Résultats avec Joint state learners ==== ==== Résultats avec Joint state learners ====
  
-Les collisions disparaissent rapidement :+Les collisions disparaissent rapidement (les deux courbes se confondent car les collisions qui arrivent a un agent arrivent forcément à l'autre):
  
 {{:rewards_collisions_grille_jsl.png|}} {{:rewards_collisions_grille_jsl.png|}}
realisation_env_grille_qlearning_sma_jsl.1756520321.txt.gz · Last modified: 2025/08/30 04:18 by 66.249.68.67