Site Tools


Hotfix release available: 2024-02-06b "Kaos". upgrade now! [55.2] (what's this?)
Hotfix release available: 2024-02-06a "Kaos". upgrade now! [55.1] (what's this?)
New release available: 2024-02-06 "Kaos". upgrade now! [55] (what's this?)
Hotfix release available: 2023-04-04b "Jack Jackrum". upgrade now! [54.2] (what's this?)
Hotfix release available: 2023-04-04a "Jack Jackrum". upgrade now! [54.1] (what's this?)
New release available: 2023-04-04 "Jack Jackrum". upgrade now! [54] (what's this?)
Hotfix release available: 2022-07-31b "Igor". upgrade now! [53.1] (what's this?)
Hotfix release available: 2022-07-31a "Igor". upgrade now! [53] (what's this?)
New release available: 2022-07-31 "Igor". upgrade now! [52.2] (what's this?)
New release candidate 2 available: rc2022-06-26 "Igor". upgrade now! [52.1] (what's this?)
New release candidate available: 2022-06-26 "Igor". upgrade now! [52] (what's this?)
Hotfix release available: 2020-07-29a "Hogfather". upgrade now! [51.4] (what's this?)
memento-learning-multi-agent-state-space-representations

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
memento-learning-multi-agent-state-space-representations [2025/03/01 18:36]
47.128.116.157 old revision restored (2025/01/25 17:46)
memento-learning-multi-agent-state-space-representations [2025/04/02 17:11] (current)
47.128.96.210 old revision restored (2025/02/12 17:36)
Line 1: Line 1:
 =====Learning multi-agent state space representations===== =====Learning multi-agent state space representations=====
  
 +==== Définitions ====
 +
 +Feed forward neural network : Réseau de neurone dans lequel il n'y a pas de boucle.
 +CQ-Learning : Coordination QLearning
 ==== Quelques informations ==== ==== Quelques informations ====
  
Line 34: Line 38:
       - Les <états, action> qui n'ont pas provoqués la collision sont marqué comme "safe"       - Les <états, action> qui n'ont pas provoqués la collision sont marqué comme "safe"
     L'algorithme ne détecte aucun changement, aucune instruction n'a lieu     L'algorithme ne détecte aucun changement, aucune instruction n'a lieu
 +
 +A chaque fois qu'un état est marqué, l'algorithme regarde si c'est un état joint dans lequel il faut prendre en considération les autres agents.
 +Si c'est le cas l'actualsisation de QjValeur de l'état sera effectué avec la formule :
 +
 +{{:capture.png?400|}}
 +
 +Sinon pas d'actualisation.
 +
 +
  
  
memento-learning-multi-agent-state-space-representations.1740850613.txt.gz · Last modified: 2025/03/01 18:36 by 47.128.116.157