This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
realisation_env_grille_qlearning_sma_jsl [2025/08/27 18:48] 66.249.68.68 old revision restored (2025/08/16 22:56) |
realisation_env_grille_qlearning_sma_jsl [2025/09/13 11:02] (current) 20.171.207.252 old revision restored (2025/08/30 05:12) |
||
---|---|---|---|
Line 1: | Line 1: | ||
===== Environnement grille - Qlearning - Joint state learners ===== | ===== Environnement grille - Qlearning - Joint state learners ===== | ||
+ | |||
+ | ==== Modifications apportées à la grille ==== | ||
+ | |||
+ | * Les récompenses sont accordées aux agents après qu'ils aient tous effectués une action. | ||
+ | * Si des agents entrent en collision, ils ne se déplacent pas | ||
+ | * Possibilité de compter le nombre de collisions | ||
+ | |||
+ | ==== Expérience ==== | ||
Même conditions que pour l' | Même conditions que pour l' | ||
Line 5: | Line 13: | ||
Rappel des résultats obtenus avec des ILs : http:// | Rappel des résultats obtenus avec des ILs : http:// | ||
+ | |||
==== Résultats avec Joint state learners ==== | ==== Résultats avec Joint state learners ==== | ||
- | Les collisions disparaissent rapidement : | + | Les collisions disparaissent rapidement |
{{: | {{: |