This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
memento-value-function-approximation [2025/09/24 10:49] 216.73.216.184 old revision restored (2025/09/12 15:17) |
memento-value-function-approximation [2025/09/24 10:49] (current) 216.73.216.184 old revision restored (2025/09/16 08:10) |
||
---|---|---|---|
Line 11: | Line 11: | ||
Définitions : | Définitions : | ||
* Off-policy : Actualisation des valeurs à partir de l' | * Off-policy : Actualisation des valeurs à partir de l' | ||
- | * On-policy : Actualisation des valeurs à partir de l' | + | * On-policy : Actualisation des valeurs à partir de l' |
===Algorithme du gradient=== | ===Algorithme du gradient=== |