This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
memento-value-function-approximation [2025/02/25 19:15] 47.128.52.0 old revision restored (2025/02/12 19:08) |
memento-value-function-approximation [2025/04/02 05:32] (current) 47.128.54.124 old revision restored (2025/02/28 18:16) |
||
---|---|---|---|
Line 11: | Line 11: | ||
Définitions : | Définitions : | ||
* Off-policy : Actualisation des valeurs à partir de l' | * Off-policy : Actualisation des valeurs à partir de l' | ||
- | * On-policy : Actualisation des valeurs à partir de l' | + | * On-policy : Actualisation des valeurs à partir de l' |
===Algorithme du gradient=== | ===Algorithme du gradient=== |