This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision | |||
|
realisation_env_grille_qlearning_sma [2025/12/31 06:56] 88.190.133.131 old revision restored (2025/11/13 12:30) |
realisation_env_grille_qlearning_sma [2026/01/01 07:22] (current) 101.128.121.47 old revision restored (2025/08/21 12:51) |
||
|---|---|---|---|
| Line 4: | Line 4: | ||
| La grille fonctionne sur le même principe que la dernière fois, les cases vertes sont parcourables, | La grille fonctionne sur le même principe que la dernière fois, les cases vertes sont parcourables, | ||
| - | |||
| - | {{: | ||
| Voir [[realisation_env_grille_qlearning | ici]] pour plus de détails. | Voir [[realisation_env_grille_qlearning | ici]] pour plus de détails. | ||
| - | La grille est générée à parti d'un fichier texte. Il est possible de passer le nombre d' | + | La grille est générée à parti d'un fichier texte. Il est possible de passer le nombre d' |
| Exemple de fichier : | Exemple de fichier : | ||
| Line 15: | Line 13: | ||
| 2 | 2 | ||
| - | BBBBBB\\ | + | BBBBBB |
| - | BSEEEB\\ | + | BSEEEB |
| - | BBBBEB\\ | + | BBBBEB |
| - | BFEEEB\\ | + | BFEEEB |
| - | BBBBEB\\ | + | BBBBEB |
| - | BSEEEB\\ | + | BSEEEB |
| - | BBBBBB\\ | + | BBBBBB |
| Le 2 indique que deux agents seront sur la grille. Ils seront placés sur les deux cases " | Le 2 indique que deux agents seront sur la grille. Ils seront placés sur les deux cases " | ||
| Line 30: | Line 28: | ||
| L' | L' | ||
| - | ==== Experience Sans collisions ==== | ||
| - | |||
| - | Deux ILs tentent d' | ||
| - | Dans ce contexte l' | ||
| - | |||
| - | {{: | ||
| - | |||
| - | On peut voir que la somme des récompenses tend vers un minimum et que les agents ne se perturbent pas. | ||
| - | |||
| - | {{: | ||
| - | |||
| - | (Somme des récompenses des deux agents - l'un en violet, l' | ||
| - | ==== Experience Tunnel To Goal ==== | ||
| - | Deux ILs évoluent sur une grille de forme Tunnel To Goal avec un QLearning (grille ci-dessous). Les deux agents essaient d' | + | ==== Experience ==== |
| - | {{: | + | Deux IL évoluent sur une grille de forme Tunnel To Goal avec un QLearning. Les deux agents essaient d' |
| - | {{: | ||
| - | (Somme des récompenses des deux agents - l'un en violet, l' | ||
| - | La récompense de -10 sur la collision à l' | ||