Site Tools


Hotfix release available: 2024-02-06b "Kaos". upgrade now! [55.2] (what's this?)
Hotfix release available: 2024-02-06a "Kaos". upgrade now! [55.1] (what's this?)
New release available: 2024-02-06 "Kaos". upgrade now! [55] (what's this?)
Hotfix release available: 2023-04-04b "Jack Jackrum". upgrade now! [54.2] (what's this?)
Hotfix release available: 2023-04-04a "Jack Jackrum". upgrade now! [54.1] (what's this?)
New release available: 2023-04-04 "Jack Jackrum". upgrade now! [54] (what's this?)
Hotfix release available: 2022-07-31b "Igor". upgrade now! [53.1] (what's this?)
Hotfix release available: 2022-07-31a "Igor". upgrade now! [53] (what's this?)
New release available: 2022-07-31 "Igor". upgrade now! [52.2] (what's this?)
New release candidate 2 available: rc2022-06-26 "Igor". upgrade now! [52.1] (what's this?)
New release candidate available: 2022-06-26 "Igor". upgrade now! [52] (what's this?)
Hotfix release available: 2020-07-29a "Hogfather". upgrade now! [51.4] (what's this?)
reflexion-gng-qc

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
reflexion-gng-qc [2025/02/22 19:54]
47.128.17.135 old revision restored (2025/02/10 22:18)
reflexion-gng-qc [2025/04/04 20:35] (current)
3.142.172.36 old revision restored (2025/03/16 04:20)
Line 5: Line 5:
 === Présentation des algos === === Présentation des algos ===
  
-Pour plus de détails, se réferrer aux articles :+Pour plus de détails, se réferrer aux mémentos :
    * CQ-Learning : http://www.aamas-conference.org/Proceedings/aamas2010/pdf/01%20Full%20Papers/15_02_FP_0421.pdf    * CQ-Learning : http://www.aamas-conference.org/Proceedings/aamas2010/pdf/01%20Full%20Papers/15_02_FP_0421.pdf
    * GNG : http://liris.cnrs.fr/sasem/doku.php?id=memento-td-gng    * GNG : http://liris.cnrs.fr/sasem/doku.php?id=memento-td-gng
Line 12: Line 12:
 Pour cela l'algo donne un ensemble d'états propre à chaque agents. Ceux-ci les développe et les trie en deux catégories "safe" et "dangerous". Un état "dangerous" est un état partagé avec un autre agent. Pour cela l'algo donne un ensemble d'états propre à chaque agents. Ceux-ci les développe et les trie en deux catégories "safe" et "dangerous". Un état "dangerous" est un état partagé avec un autre agent.
  
-GNG permet de partitionner l'ensemble des états et de les regrouper par noeuds où tous les états d'un même noeud auront le même tuple <étataction> et les même Qvaleurs. Ce procédé réduit artificiellement le nombre d'états et induit une convergence plus rapide des Qvaleurs tout en limitant l'usage de la mémoire.+GNG permet de limiter le nombre d'états dont s'occupe un agentce qui induit une convergence plus rapide des Qvaleurs et limite l'usage de la mémoire.
  
 === Piste === === Piste ===
reflexion-gng-qc.1740250498.txt.gz · Last modified: 2025/02/22 19:54 by 47.128.17.135