This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
realisation_env_grille_qlearning_sma [2025/05/24 03:33] 47.128.31.127 old revision restored (2025/02/28 19:12) |
realisation_env_grille_qlearning_sma [2025/07/11 10:04] (current) 47.128.33.131 old revision restored (2025/03/07 18:06) |
||
---|---|---|---|
Line 13: | Line 13: | ||
2 | 2 | ||
- | BBBBBB | + | BBBBBB\\ |
- | BSEEEB | + | BSEEEB\\ |
- | BBBBEB | + | BBBBEB\\ |
- | BFEEEB | + | BFEEEB\\ |
- | BBBBEB | + | BBBBEB\\ |
- | BSEEEB | + | BSEEEB\\ |
- | BBBBBB | + | BBBBBB\\ |
Le 2 indique que deux agents seront sur la grille. Ils seront placés sur les deux cases " | Le 2 indique que deux agents seront sur la grille. Ils seront placés sur les deux cases " | ||
Line 28: | Line 28: | ||
L' | L' | ||
+ | {{: | ||
+ | ==== Experience Tunnel To Goal ==== | ||
- | ==== Experience ==== | + | Deux IL évoluent sur une grille de forme Tunnel To Goal avec un QLearning (grille ci-dessus). Les deux agents essaient d' |
- | Deux IL évoluent sur une grille de forme Tunnel To Goal avec un QLearning. Les deux agents | + | {{: |
+ | (Somme des récompenses des deux agents | ||
+ | La récompense de -10 sur la collision à l' | ||
+ | ==== Experience Sans collisions ==== | ||
+ | Même test en prenant une grille dans laquelle il n'y a pas de collisions. | ||
+ | |||
+ | {{: | ||
+ | |||
+ | On peut voir que la somme des récompenses tend vers un minimum et que les agents ne se perturbent pas. | ||
+ | |||
+ | {{: | ||
+ | (Somme des récompenses des deux agents - l'un en violet, l' |