This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
realisation_env_grille_qlearning_sma [2025/04/19 22:03] 3.142.54.53 old revision restored (2025/02/24 19:10) |
realisation_env_grille_qlearning_sma [2025/06/07 02:55] (current) 216.73.216.125 old revision restored (2025/05/21 09:09) |
||
---|---|---|---|
Line 30: | Line 30: | ||
{{: | {{: | ||
- | ==== Experience | + | ==== Experience ==== |
- | Deux ILs tentent d' | + | Deux IL évoluent sur une grille |
- | Dans ce contexte l' | + | |
- | + | ||
- | {{: | + | |
- | + | ||
- | On peut voir que la somme des récompenses tend vers un minimum et que les agents ne se perturbent pas. | + | |
- | + | ||
- | {{: | + | |
+ | {{: | ||
(Somme des récompenses des deux agents - l'un en violet, l' | (Somme des récompenses des deux agents - l'un en violet, l' | ||
- | ==== Experience Tunnel To Goal ==== | + | La récompense de -10 sur la collision à l' |
- | Deux ILs évoluent sur une grille de forme Tunnel To Goal avec un QLearning (grille ci-dessous). Les deux agents essaient d' | ||
- | |||
- | {{: | ||
- | |||
- | |||
- | {{: | ||
- | (Somme des récompenses des deux agents - l'un en violet, l' | ||
- | |||
- | La récompense de -10 sur la collision à l' |