This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
|
realisation_env_grille_qlearning_sma [2025/11/11 07:43] 66.249.70.198 old revision restored (2025/08/26 20:55) |
realisation_env_grille_qlearning_sma [2025/11/13 00:49] (current) 103.228.201.100 old revision restored (2025/07/03 18:09) |
||
|---|---|---|---|
| Line 13: | Line 13: | ||
| 2 | 2 | ||
| - | BBBBBB | + | BBBBBB\\ |
| - | BSEEEB | + | BSEEEB\\ |
| - | BBBBEB | + | BBBBEB\\ |
| - | BFEEEB | + | BFEEEB\\ |
| - | BBBBEB | + | BBBBEB\\ |
| - | BSEEEB | + | BSEEEB\\ |
| - | BBBBBB | + | BBBBBB\\ |
| Le 2 indique que deux agents seront sur la grille. Ils seront placés sur les deux cases " | Le 2 indique que deux agents seront sur la grille. Ils seront placés sur les deux cases " | ||
| Line 28: | Line 28: | ||
| L' | L' | ||
| + | {{: | ||
| ==== Experience ==== | ==== Experience ==== | ||
| - | Deux IL évoluent sur une grille de forme Tunnel To Goal avec un QLearning. Les deux agents essaient d' | + | Deux IL évoluent sur une grille de forme Tunnel To Goal avec un QLearning |
| + | {{: | ||
| + | (Somme des récompenses des deux agents - l'un en violet, l' | ||
| + | La récompense de -10 sur la collision à l' | ||