This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
|
realisation_env_grille_cqlearning_cmu_tr_ttg [2025/12/18 17:38] 47.128.59.233 old revision restored (2025/11/28 05:07) |
realisation_env_grille_cqlearning_cmu_tr_ttg [2026/01/04 01:30] (current) 45.181.121.31 old revision restored (2025/11/20 23:29) |
||
|---|---|---|---|
| Line 3: | Line 3: | ||
| Article utilisé : http:// | Article utilisé : http:// | ||
| - | ==== Présentation ==== | + | Synthèse |
| - | + | ||
| - | Le CQ-Learning permet la coordination d' | + | |
| - | + | ||
| - | Les agents suivent leur politique optimale jusqu' | + | |
| - | + | ||
| - | Etant donné que certaines parties de l' | + | |
| - | + | ||
| - | ==== Expérience ==== | + | |
| - | + | ||
| - | L' | + | |
| - | + | ||
| - | + | ||
| - | CMU | + | |
| - | {{:cmu_exemple.png? | + | |
| - | + | ||
| - | Les cases de couleurs sont les objectifs des agents de même couleur (sauf dans le ttg où il les deux agent sont le même objectif). | + | |
| - | + | ||
| - | Seul les résultats pour le CMU seront montrés. | + | |
| - | ==== Resultats ==== | + | |
| - | Les moyennes sont effectuées sur 125 itérations. | + | |
| - | + | ||
| - | === CMU === | + | |
| - | + | ||
| - | Moyenne des sommes des récompenses | + | |
| - | {{: | + | |
| - | + | ||
| - | Moyenne du nombre de collisions :\\ | + | |
| - | {{: | + | |
| - | + | ||
| - | Moyenne du nombre d' | + | |
| - | {{: | + | |
| - | + | ||
| - | Petite optimisation sur les états joints, lorsqu' | + | |
| - | + | ||
| - | A la 4 000eme itération, la politique devient déterministe, | + | |