Site Tools


Hotfix release available: 2025-05-14b "Librarian". upgrade now! [56.2] (what's this?)
Hotfix release available: 2025-05-14a "Librarian". upgrade now! [56.1] (what's this?)
New release available: 2025-05-14 "Librarian". upgrade now! [56] (what's this?)
Hotfix release available: 2024-02-06b "Kaos". upgrade now! [55.2] (what's this?)
Hotfix release available: 2024-02-06a "Kaos". upgrade now! [55.1] (what's this?)
New release available: 2024-02-06 "Kaos". upgrade now! [55] (what's this?)
Hotfix release available: 2023-04-04b "Jack Jackrum". upgrade now! [54.2] (what's this?)
Hotfix release available: 2023-04-04a "Jack Jackrum". upgrade now! [54.1] (what's this?)
New release available: 2023-04-04 "Jack Jackrum". upgrade now! [54] (what's this?)
Hotfix release available: 2022-07-31b "Igor". upgrade now! [53.1] (what's this?)
Hotfix release available: 2022-07-31a "Igor". upgrade now! [53] (what's this?)
New release available: 2022-07-31 "Igor". upgrade now! [52.2] (what's this?)
New release candidate 2 available: rc2022-06-26 "Igor". upgrade now! [52.1] (what's this?)
New release candidate available: 2022-06-26 "Igor". upgrade now! [52] (what's this?)
Hotfix release available: 2020-07-29a "Hogfather". upgrade now! [51.4] (what's this?)
realisation_env_grille_cqlearning_cmu_tr_ttg

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
realisation_env_grille_cqlearning_cmu_tr_ttg [2025/08/29 06:05]
47.72.133.148 old revision restored (2025/08/10 05:22)
realisation_env_grille_cqlearning_cmu_tr_ttg [2025/09/14 03:36] (current)
20.171.207.252 old revision restored (2025/08/22 02:37)
Line 14: Line 14:
  
 L'algorithme est testé sur trois environnements différents, un Tunnel to Goal (ttg) un cmu (quoi que cela puisse vouloir dire), et un Two Robots Game (tr). L'algorithme est testé sur trois environnements différents, un Tunnel to Goal (ttg) un cmu (quoi que cela puisse vouloir dire), et un Two Robots Game (tr).
- 
  
 CMU CMU
 {{:cmu_exemple.png?500|}} {{:cmu_exemple.png?500|}}
 +
 +TR
 +{{:tr_exemple.png?300|}}
 +
 +TTG
 +{{:ttg_exemple.png?300|}}
  
 Les cases de couleurs sont les objectifs des agents de même couleur (sauf dans le ttg où il les deux agent sont le même objectif). Les cases de couleurs sont les objectifs des agents de même couleur (sauf dans le ttg où il les deux agent sont le même objectif).
- 
-Seul les résultats pour le CMU seront montrés. 
 ==== Resultats ==== ==== Resultats ====
-Les moyennes sont effectuées sur 125 itérations. 
- 
-=== CMU === 
- 
-Moyenne des sommes des récompenses :\\ 
-{{:cmu_rewards.png?500|}} 
- 
-Moyenne du nombre de collisions :\\ 
-{{:cmu_collisions.png?500|}} 
- 
-Moyenne du nombre d'états joints (contrairement à la légende) :\\ 
-{{:cmu2_nbjs_opti.png?500|}} \\ 
- 
-Petite optimisation sur les états joints, lorsqu'ils n'ont pas été utilisés depuis trop longtemps, ceux-ci sont supprimés. 
- 
-A la 4 000eme itération, la politique devient déterministe, l'agent ne peut plus choisir d'actions aléatoirement. Il n'y a plus de collisions surprise et donc seul les états joints utiles sont gardés. 
realisation_env_grille_cqlearning_cmu_tr_ttg.1756440306.txt.gz · Last modified: 2025/08/29 06:05 by 47.72.133.148