This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
|
realisation_env_grille_cqlearning_cmu_tr_ttg [2025/11/05 11:01] 192.161.54.174 old revision restored (2025/10/10 01:53) |
realisation_env_grille_cqlearning_cmu_tr_ttg [2025/11/13 02:36] (current) 216.73.216.15 old revision restored (2025/11/11 23:23) |
||
|---|---|---|---|
| Line 23: | Line 23: | ||
| Seul les résultats pour le CMU seront montrés. | Seul les résultats pour le CMU seront montrés. | ||
| ==== Resultats ==== | ==== Resultats ==== | ||
| - | Les moyennes sont effectuées sur 125 itérations. | ||
| === CMU === | === CMU === | ||
| + | |||
| + | A la 3 000eme itération, la politique devient déterministe, | ||
| Moyenne des sommes des récompenses :\\ | Moyenne des sommes des récompenses :\\ | ||
| - | {{:cmu_rewards.png?500|}} | + | {{:cmu3_rewards.png?500|}} |
| Moyenne du nombre de collisions :\\ | Moyenne du nombre de collisions :\\ | ||
| - | {{:cmu_collisions.png?500|}} | + | {{:cmu3_collisions.png?500|}} |
| + | |||
| + | Moyenne du nombre d' | ||
| + | {{: | ||
| + | |||
| + | Petite optimisation sur les états joints, lorsqu' | ||
| + | |||
| + | Voici les stats obtenues en lançant l' | ||
| + | |||
| + | En moyenne, les agents ont besoin de -10.9 etapes \\ | ||
| + | Avec un ecart-type de | ||
| + | |||
| + | En moyenne, les agents ont 0.0 collisions \\ | ||
| + | Avec un ecart-type de 0.0 | ||
| + | |||
| + | En moyenne, les agents ont 1.9 etats joints \\ | ||
| + | Avec un ecart-type de | ||
| - | Moyenne du nombre d' | ||
| - | {{: | ||
| - | Petite optimisation sur les états joints, lorsqu' | ||
| - | A la 4 000eme itération, la politique devient déterministe, | ||