This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
|
memento-learning-multi-agent-state-space-representations [2025/12/16 21:42] 47.128.40.74 old revision restored (2025/10/20 22:27) |
memento-learning-multi-agent-state-space-representations [2026/01/05 23:35] (current) 47.128.112.30 old revision restored (2025/11/28 12:25) |
||
|---|---|---|---|
| Line 1: | Line 1: | ||
| =====Learning multi-agent state space representations===== | =====Learning multi-agent state space representations===== | ||
| - | |||
| - | ==== Définitions ==== | ||
| - | |||
| - | Feed forward neural network : Réseau de neurone dans lequel il n'y a pas de boucle. | ||
| ==== Quelques informations ==== | ==== Quelques informations ==== | ||
| Line 26: | Line 22: | ||
| ==== CQ-Learning ==== | ==== CQ-Learning ==== | ||
| - | En partant du principe que les agents ont une politique optimale ainsi qu'une récompense associée à chaque tuple <état, action>. | ||
| - | |||
| - | Les agents ont deux ensembles d' | ||
| - | |||
| - | L' | ||
| - | * L' | ||
| - | - Marquage de l' | ||
| - | - Recherche de la cause du changement | ||
| - | - Paire <état, action> marquée comme " | ||
| - | - Ajout de l' | ||
| - | - Les <états, action> qui n'ont pas provoqués la collision sont marqué comme " | ||
| - | | ||
| - | |||
| - | A chaque fois qu'un état est marqué, l' | ||
| - | Si c'est le cas l' | ||
| - | |||
| - | {{: | ||
| - | |||
| - | Sinon pas d' | ||