Site Tools


Hotfix release available: 2024-02-06b "Kaos". upgrade now! [55.2] (what's this?)
Hotfix release available: 2024-02-06a "Kaos". upgrade now! [55.1] (what's this?)
New release available: 2024-02-06 "Kaos". upgrade now! [55] (what's this?)
Hotfix release available: 2023-04-04b "Jack Jackrum". upgrade now! [54.2] (what's this?)
Hotfix release available: 2023-04-04a "Jack Jackrum". upgrade now! [54.1] (what's this?)
New release available: 2023-04-04 "Jack Jackrum". upgrade now! [54] (what's this?)
Hotfix release available: 2022-07-31b "Igor". upgrade now! [53.1] (what's this?)
Hotfix release available: 2022-07-31a "Igor". upgrade now! [53] (what's this?)
New release available: 2022-07-31 "Igor". upgrade now! [52.2] (what's this?)
New release candidate 2 available: rc2022-06-26 "Igor". upgrade now! [52.1] (what's this?)
New release candidate available: 2022-06-26 "Igor". upgrade now! [52] (what's this?)
Hotfix release available: 2020-07-29a "Hogfather". upgrade now! [51.4] (what's this?)
realisation_env_grille_qlearning

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
realisation_env_grille_qlearning [2024/06/14 21:33]
47.128.20.65 old revision restored (2024/06/08 00:44)
realisation_env_grille_qlearning [2024/08/15 18:49] (current)
47.128.99.99 old revision restored (2024/06/11 06:31)
Line 5: Line 5:
 L'environnement est une grille modifiable à partir d'un fichier texte tel que ci dessous : L'environnement est une grille modifiable à partir d'un fichier texte tel que ci dessous :
  
-BBBBBBB +BBBBBBB \\ 
-BSEEEEB +BSEEEEB \\ 
-BEBEBEB +BEBEBEB \\ 
-BEEEBEB +BEEEBEB \\ 
-BEBEEEB +BEBEEEB \\ 
-BEBBBEB +BEBBBEB \\ 
-BEEEEFB +BEEEEFB \\ 
-BBBBBBB+BBBBBBB \\
  
-B = block +B = block \\ 
-E = empty +E = empty \\ 
-S = start +S = start \\ 
-F = finish+F = finish \\
  
 Elle contient une case de départ, une case de fin et un agent (et bientôt la possibilité d'en mettre plus). Elle contient une case de départ, une case de fin et un agent (et bientôt la possibilité d'en mettre plus).
Line 43: Line 43:
 L'agent apprend petit à petit jusqu'à ce que ses qvaleurs convergent. La stratégie s'affine et devient intéressante à partir du 300ième épisode. L'agent apprend petit à petit jusqu'à ce que ses qvaleurs convergent. La stratégie s'affine et devient intéressante à partir du 300ième épisode.
  
 +==== La suite ====
  
 +Appliquer ce QLearning au MountainCar et au Pendule.
realisation_env_grille_qlearning.1718393597.txt.gz · Last modified: 2024/06/14 21:33 by 47.128.20.65