This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
compte-rendu-etat-art-these [2025/04/20 02:34] 18.116.69.162 old revision restored (2025/04/15 03:51) |
compte-rendu-etat-art-these [2025/05/23 02:26] (current) 66.249.66.40 old revision restored (2025/05/07 09:27) |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | ===== Compte-rendu | + | ===== Mémento |
==Types d’apprentissage artificiel== | ==Types d’apprentissage artificiel== | ||
Line 24: | Line 24: | ||
Recherche de points commun dans les données contextuellement à l' | Recherche de points commun dans les données contextuellement à l' | ||
Exemple : ? | Exemple : ? | ||
+ | |||
+ | |||
+ | < | ||
+ | * Méthode simple d'app non supervisé: K-means [[https:// | ||
+ | * Autre méthodes: cartes auto-organisées (SOM) cf. cours [[http:// | ||
+ | * Exemple de carte SOM utilisé en RL pour représenter les états: | ||
+ | * [[http:// | ||
+ | * [[m1r2017: | ||
+ | </ | ||
===Apprentissage par récompense=== | ===Apprentissage par récompense=== | ||
Line 131: | Line 140: | ||
* C’est un apprentissage ouvert (open-ended) : l’apprentissage d’un concept offre la possibilité d’apprendre un nouveau concept | * C’est un apprentissage ouvert (open-ended) : l’apprentissage d’un concept offre la possibilité d’apprendre un nouveau concept | ||
+ | ===L’apprentissage sensorimoteur=== | ||
+ | |||
+ | Apprentissage sensorimoteur en premier lieu. Cet apprentissage doit permettre à l' | ||
+ | |||
+ | ===Mécanismes d’apprentissage de schémas=== | ||
+ | |||
+ | Schema learning : technique d' | ||
+ | |||
+ | Schéma : Triplet (Contexte, Action, Prédiction). | ||
+ | |||
+ | Ce système représente donc les conséquences de chaque actions à partir d'un contexte. | ||
+ | |||
+ | Problème d' | ||
+ | |||
+ | Solution proposée : notions d' | ||
+ | Un résultat est jugé pertinent si le résultat apparait plus souvent lorsque l' | ||
+ | |||
+ | Lorsque le résultat est pertinent, il faut savoir quand il est fiable. Il faut être capable de trouver les contextes permettant de distinguer les cas de succès et d' | ||
+ | |||
+ | <note important> | ||
+ | |||
+ | Ce type d' | ||
+ | |||
+ | Deux solution proposées : | ||
+ | * Ajout d'item synthétique -> Lorqu' | ||
+ | * Actions composites -> actions formées de plusieurs schémas pour atteindre un but. | ||
+ | |||
+ | ====La robotique développementale==== | ||
+ | ====Le problème d’amorçage==== | ||
+ | |||
+ | Le système va apprendre incrémentalement à partir d'un état initial. Quel est-il ? | ||
+ | Pour faire apprendre les régularités au système, on peut se baser sur un certain point de vue comme la proximité temporelle entre deux évènements, | ||
+ | Mais quel point de vue prendre si l'on veut apprendre sur la base d'un flot de données brute ? Faut-il essayer une multitude de point de vue pour trouver des régularités ? Existe-t-il certains points de vue permettant d' | ||
+ | Si l'on sait ce que l'on veut apprendre, on pourrait guider le processus de discrétisation des données pour qu'il fournisse des données plus adapté à la représentation. | ||
+ | En poussant ce principe un peu plus loin, il serait possible d' |