This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
realisation_env_grille_qlearning_sma_jsl [2025/04/19 22:03] 3.142.54.53 old revision restored (2024/09/14 01:18) |
realisation_env_grille_qlearning_sma_jsl [2025/05/13 06:42] (current) 3.148.108.24 old revision restored (2024/07/05 19:05) |
||
---|---|---|---|
Line 1: | Line 1: | ||
===== Environnement grille - Qlearning - Joint state learners ===== | ===== Environnement grille - Qlearning - Joint state learners ===== | ||
- | |||
- | ==== Modifications apportées à la grille ==== | ||
- | |||
- | * Les récompenses sont accordées aux agents après qu'ils aient tous effectués une action. | ||
- | * Si des agents entrent en collision, ils ne se déplacent pas | ||
- | * Possibilité de compter le nombre de collisions | ||
- | |||
- | ==== Expérience ==== | ||
Même conditions que pour l' | Même conditions que pour l' | ||
Line 13: | Line 5: | ||
Rappel des résultats obtenus avec des ILs : http:// | Rappel des résultats obtenus avec des ILs : http:// | ||
- | |||
==== Résultats avec Joint state learners ==== | ==== Résultats avec Joint state learners ==== | ||
- | Les collisions disparaissent rapidement | + | Les collisions disparaissent rapidement : |
{{: | {{: |