This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
realisation_env_grille_cqlearning_cmu_tr_ttg [2025/07/03 20:10] 216.73.216.192 old revision restored (2025/07/01 03:21) |
realisation_env_grille_cqlearning_cmu_tr_ttg [2025/07/06 22:08] (current) 216.73.216.208 old revision restored (2025/07/03 21:47) |
||
---|---|---|---|
Line 3: | Line 3: | ||
Article utilisé : http:// | Article utilisé : http:// | ||
- | ==== Présentation ==== | + | Synthèse |
- | + | ||
- | Le CQ-Learning permet la coordination d' | + | |
- | + | ||
- | Les agents suivent leur politique optimale jusqu' | + | |
- | + | ||
- | Etant donné que certaines parties de l' | + | |
- | + | ||
- | ==== Expérience ==== | + | |
- | + | ||
- | L' | + | |
- | + | ||
- | CMU | + | |
- | {{:cmu_exemple.png? | + | |
- | + | ||
- | TR | + | |
- | {{:tr_exemple.png? | + | |
- | + | ||
- | TTG | + | |
- | {{: | + | |
- | + | ||
- | Les cases de couleurs sont les objectifs des agents de même couleur (sauf dans le ttg où il les deux agent sont le même objectif). | + | |
- | ==== Resultats ==== | + | |
- | Les moyennes sont effectuées sur 125 itérations. | + | |
- | + | ||
- | === CMU === | + | |
- | + | ||
- | Moyenne des sommes des récompenses :\\ | + | |
- | {{: | + | |
- | + | ||
- | Moyenne du nombre de collisions :\\ | + | |
- | {{: | + | |
- | + | ||
- | Nombre d' | + | |
- | {{: | + | |
- | + | ||
- | Petite optimisation sur les états joints, lorsqu' | + | |
- | Environ 45 JS sont crées si on ne les supprime pas. Ceci peut s' | + |