This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
realisation_env_grille_cqlearning_cmu_tr_ttg [2025/03/07 19:26] 47.128.113.81 old revision restored (2025/01/27 18:32) |
realisation_env_grille_cqlearning_cmu_tr_ttg [2025/04/16 15:39] (current) 3.140.188.79 old revision restored (2025/03/04 18:44) |
||
---|---|---|---|
Line 5: | Line 5: | ||
==== Présentation ==== | ==== Présentation ==== | ||
- | Le CQ-Learning permet la coordination d' | + | ==== Experience ==== |
- | Les agents suivent leur politique optimale jusqu' | ||
- | |||
- | Etant donné que certaines parties de l' | ||
- | |||
- | ==== Expérience ==== | ||
- | |||
- | L' | ||
- | |||
- | |||
- | CMU | ||
- | {{: | ||
- | |||
- | Les cases de couleurs sont les objectifs des agents de même couleur (sauf dans le ttg où il les deux agent sont le même objectif). | ||
- | |||
- | Seul les résultats pour le CMU seront montrés. | ||
==== Resultats ==== | ==== Resultats ==== | ||
- | Les moyennes sont effectuées sur 125 itérations. | ||
- | |||
- | === CMU === | ||
- | |||
- | Moyenne des sommes des récompenses :\\ | ||
- | {{: | ||
- | |||
- | Moyenne du nombre de collisions :\\ | ||
- | {{: | ||
- | |||
- | Moyenne du nombre d' | ||
- | {{: | ||
- | |||
- | Petite optimisation sur les états joints, lorsqu' | ||
- | |||
- | A la 4 000eme itération, la politique devient déterministe, |