This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
realisation_env_grille_qlearning_sma [2025/09/06 18:19] 66.249.68.35 old revision restored (2025/08/11 11:13) |
realisation_env_grille_qlearning_sma [2025/09/24 02:42] (current) 156.235.69.42 old revision restored (2025/09/15 10:04) |
||
---|---|---|---|
Line 30: | Line 30: | ||
{{: | {{: | ||
- | ==== Experience ==== | + | ==== Experience |
Deux IL évoluent sur une grille de forme Tunnel To Goal avec un QLearning (grille ci-dessus). Les deux agents essaient d' | Deux IL évoluent sur une grille de forme Tunnel To Goal avec un QLearning (grille ci-dessus). Les deux agents essaient d' | ||
- | {{: | + | {{: |
(Somme des récompenses des deux agents - l'un en violet, l' | (Somme des récompenses des deux agents - l'un en violet, l' | ||
La récompense de -10 sur la collision à l' | La récompense de -10 sur la collision à l' | ||
+ | ==== Experience Sans collisions ==== | ||
+ | |||
+ | Même test en prenant une grille dans laquelle il n'y a pas de collisions. | ||
+ | |||
+ | {{: | ||
+ | |||
+ | On peut voir que la somme des récompenses tend vers un minimum et que les agents ne se perturbent pas. | ||
+ | |||
+ | {{: | ||
+ | |||
+ | (Somme des récompenses des deux agents - l'un en violet, l' |