Site Tools


New release available: 2025-05-14 "Librarian". upgrade now! [56] (what's this?)
Hotfix release available: 2024-02-06b "Kaos". upgrade now! [55.2] (what's this?)
Hotfix release available: 2024-02-06a "Kaos". upgrade now! [55.1] (what's this?)
New release available: 2024-02-06 "Kaos". upgrade now! [55] (what's this?)
Hotfix release available: 2023-04-04b "Jack Jackrum". upgrade now! [54.2] (what's this?)
Hotfix release available: 2023-04-04a "Jack Jackrum". upgrade now! [54.1] (what's this?)
New release available: 2023-04-04 "Jack Jackrum". upgrade now! [54] (what's this?)
Hotfix release available: 2022-07-31b "Igor". upgrade now! [53.1] (what's this?)
Hotfix release available: 2022-07-31a "Igor". upgrade now! [53] (what's this?)
New release available: 2022-07-31 "Igor". upgrade now! [52.2] (what's this?)
New release candidate 2 available: rc2022-06-26 "Igor". upgrade now! [52.1] (what's this?)
New release candidate available: 2022-06-26 "Igor". upgrade now! [52] (what's this?)
Hotfix release available: 2020-07-29a "Hogfather". upgrade now! [51.4] (what's this?)
realisation_env_grille_cqlearning_cmu_tr_ttg

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
realisation_env_grille_cqlearning_cmu_tr_ttg [2025/04/18 19:24]
18.188.60.244 old revision restored (2025/02/13 05:39)
realisation_env_grille_cqlearning_cmu_tr_ttg [2025/05/21 23:36] (current)
3.147.104.221 old revision restored (2025/05/14 07:28)
Line 23: Line 23:
 Seul les résultats pour le CMU seront montrés. Seul les résultats pour le CMU seront montrés.
 ==== Resultats ==== ==== Resultats ====
 +
 +Voici les stats obtenues en lançant l'expérience 5 fois consécutives :
  
 === CMU === === CMU ===
  
-A la 000eme itération, la politique devient déterministe, l'agent ne peut plus choisir d'actions aléatoirement. +A la 000eme itération, la politique devient déterministe, l'agent ne peut plus choisir d'actions aléatoirement. 
  
 Moyenne des sommes des récompenses :\\ Moyenne des sommes des récompenses :\\
-{{:cmu2_rewards.png?500|}}+{{:cmu3_rewards.png?500|}}
  
 Moyenne du nombre de collisions :\\ Moyenne du nombre de collisions :\\
-{{:cmu2_collisions.png?500|}}+{{:cmu3_collisions.png?500|}}
  
 Moyenne du nombre d'états joints :\\ Moyenne du nombre d'états joints :\\
-{{:cmu2_nbjs.png?500|}}+{{:cmu3_nbjs.png?500|}}
  
-Petite optimisation sur les états joints, lorsqu'ils n'ont pas été utilisés depuis trop longtemps, ceux-ci sont supprimés. Ils le sont aussi lorsqu'ils indiquent la même action que l'état individuelle.+Petite optimisation sur les états joints, lorsqu'ils n'ont pas été utilisés depuis trop longtemps, ceux-ci sont supprimés. Ils le sont aussi lorsqu'ils indiquent la même action que l'état individuel.
  
-Voici les stats obtenues en lançant l'expérience 5 fois :+ 
 +Stats :
    
-En moyenne, les agents ont besoin de  13. etapes\\ +En moyenne, les agents ont besoin de  -10. etapes \\ 
-Avec un ecart-type de   6.23217458035+Avec un ecart-type de   0.943398113206
  
 En moyenne, les agents ont  0.0  collisions \\ En moyenne, les agents ont  0.0  collisions \\
 Avec un ecart-type de   0.0 Avec un ecart-type de   0.0
  
-En moyenne, les agents ont  1. etats joints \\ +En moyenne, les agents ont  1. etats joints \\ 
-Avec un ecart-type de   1.41774468788+Avec un ecart-type de   1.13578166916  
  
  
realisation_env_grille_cqlearning_cmu_tr_ttg.1744997097.txt.gz · Last modified: 2025/04/18 19:24 by 18.188.60.244