This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
memento-intrinsically-motivated-rl [2025/02/28 19:10] 47.128.45.6 old revision restored (2025/02/11 17:23) |
memento-intrinsically-motivated-rl [2025/04/03 04:06] (current) 47.128.59.250 old revision restored (2025/02/24 17:31) |
||
---|---|---|---|
Line 1: | Line 1: | ||
=====Memento sur [Singh2005]===== | =====Memento sur [Singh2005]===== | ||
- | |||
- | * motivation intrinsèque : action provoquée par la recherche d'une récompense. | ||
- | * motivation extrinsèque : action provoquée par l' | ||
- | |||
- | L' | ||
- | |||
- | En appliquant ça au RL, il est possible de développer le système agent-environnement classique. Les récompenses ne viendraient pas de l' | ||
- | |||
- | Option : ressemble à une sous-routine. Ca consiste en : | ||
- | * Une politique : indique à l' | ||
- | * Un ensemble d' | ||
- | * Une condition de fin | ||
- | |||
- | Deux composants des options sont important : | ||
- | * Les modèles d' | ||
- | * La méthode d' | ||
- | |||
- |