Site Tools


Hotfix release available: 2024-02-06b "Kaos". upgrade now! [55.2] (what's this?)
Hotfix release available: 2024-02-06a "Kaos". upgrade now! [55.1] (what's this?)
New release available: 2024-02-06 "Kaos". upgrade now! [55] (what's this?)
Hotfix release available: 2023-04-04b "Jack Jackrum". upgrade now! [54.2] (what's this?)
Hotfix release available: 2023-04-04a "Jack Jackrum". upgrade now! [54.1] (what's this?)
New release available: 2023-04-04 "Jack Jackrum". upgrade now! [54] (what's this?)
Hotfix release available: 2022-07-31b "Igor". upgrade now! [53.1] (what's this?)
Hotfix release available: 2022-07-31a "Igor". upgrade now! [53] (what's this?)
New release available: 2022-07-31 "Igor". upgrade now! [52.2] (what's this?)
New release candidate 2 available: rc2022-06-26 "Igor". upgrade now! [52.1] (what's this?)
New release candidate available: 2022-06-26 "Igor". upgrade now! [52] (what's this?)
Hotfix release available: 2020-07-29a "Hogfather". upgrade now! [51.4] (what's this?)
realisation_env_grille_qlearning

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
realisation_env_grille_qlearning [2025/04/19 21:58]
3.18.223.22 old revision restored (2024/06/11 06:31)
realisation_env_grille_qlearning [2025/04/19 21:58] (current)
3.18.223.22 old revision restored (2024/05/15 20:20)
Line 3: Line 3:
 ==== Expérience ==== ==== Expérience ====
  
-L'environnement est une grille modifiable à partir d'un fichier texte tel que ci dessous : +L'environnement est une grille modifiable à partir d'un fichier texteElle contient une case de départ, une case de fin et un agent (et bientôt la possibilité d'en mettre plus).
- +
-BBBBBBB \\ +
-BSEEEEB \\ +
-BEBEBEB \\ +
-BEEEBEB \\ +
-BEBEEEB \\ +
-BEBBBEB \\ +
-BEEEEFB \\ +
-BBBBBBB \\ +
- +
-B = block \\ +
-E = empty \\ +
-S = start \\ +
-F = finish \\ +
- +
-Elle contient une case de départ, une case de fin et un agent (et bientôt la possibilité d'en mettre plus).+
  
 La grille (d'une grande beauté) est représentée comme ci dessous : La grille (d'une grande beauté) est représentée comme ci dessous :
Line 43: Line 27:
 L'agent apprend petit à petit jusqu'à ce que ses qvaleurs convergent. La stratégie s'affine et devient intéressante à partir du 300ième épisode. L'agent apprend petit à petit jusqu'à ce que ses qvaleurs convergent. La stratégie s'affine et devient intéressante à partir du 300ième épisode.
  
-==== La suite ==== 
  
-Appliquer ce QLearning au MountainCar et au Pendule. 
realisation_env_grille_qlearning.txt · Last modified: 2025/04/19 21:58 by 3.18.223.22