This shows you the differences between two versions of the page.
Both sides previous revision Previous revision | |||
realisation_env_grille_qlearning_sma [2025/05/21 09:09] 124.243.169.60 old revision restored (2025/05/13 21:15) |
realisation_env_grille_qlearning_sma [2025/05/24 03:33] (current) 47.128.31.127 old revision restored (2025/02/28 19:12) |
||
---|---|---|---|
Line 13: | Line 13: | ||
2 | 2 | ||
- | BBBBBB\\ | + | BBBBBB |
- | BSEEEB\\ | + | BSEEEB |
- | BBBBEB\\ | + | BBBBEB |
- | BFEEEB\\ | + | BFEEEB |
- | BBBBEB\\ | + | BBBBEB |
- | BSEEEB\\ | + | BSEEEB |
- | BBBBBB\\ | + | BBBBBB |
Le 2 indique que deux agents seront sur la grille. Ils seront placés sur les deux cases " | Le 2 indique que deux agents seront sur la grille. Ils seront placés sur les deux cases " | ||
Line 28: | Line 28: | ||
L' | L' | ||
- | {{: | + | |
==== Experience ==== | ==== Experience ==== | ||
- | Deux IL évoluent sur une grille de forme Tunnel To Goal avec un QLearning | + | Deux IL évoluent sur une grille de forme Tunnel To Goal avec un QLearning. Les deux agents essaient d' |
- | {{: | ||
- | (Somme des récompenses des deux agents - l'un en violet, l' | ||
- | La récompense de -10 sur la collision à l' | ||