This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
|
compte-rendu-etat-art-these [2025/12/30 07:08] 47.128.124.79 old revision restored (2025/10/18 07:15) |
compte-rendu-etat-art-these [2026/01/10 12:38] (current) 66.249.70.200 old revision restored (2025/08/31 01:45) |
||
|---|---|---|---|
| Line 54: | Line 54: | ||
| Triplet de capteurs (O, M, C) [Objet, Mouvement, Contextuel], | Triplet de capteurs (O, M, C) [Objet, Mouvement, Contextuel], | ||
| Représentations définies sur un triplet (E, C, A) [Evenement, Condition, Action], | Représentations définies sur un triplet (E, C, A) [Evenement, Condition, Action], | ||
| - | Algo de classification -> chercher des motifs d' | ||
| - | ====Les systèmes multi-agents==== | ||
| - | Système complexe : système qui a un effet sur son environnement et ses propres composantes. | ||
| - | |||
| - | Application des SMA : | ||
| - | * alternative à la résolution de problèmes centralisés | ||
| - | * la simulation (biologie, sociologie...) | ||
| - | * paradigme de programmation | ||
| - | |||
| - | Façons d' | ||
| - | * Un système peut être améliorer en dotant ses agents de capacités d' | ||
| - | * Les agents peuvent apprendre de manière distribué et interactive -> c'est le système qui apprend par l' | ||
| - | |||
| - | Catégories d' | ||
| - | * apprentissage centralisé : les agents apprennent seul. | ||
| - | * apprentissage décentralisé : les agents sont impliqués dans la même activé d' | ||
| - | L' | ||
| - | |||
| - | |||
| - | |||
| - | ===Attribution des récompenses=== | ||
| - | |||
| - | Difficulté de donner des récompenses, | ||
| - | (CAP : Credit Assignement Problem) | ||
| - | |||
| - | Décomposition du problème en deux sous problèmes : | ||
| - | * CAP inter-agent : Rétribution des agents en fonction d'un changement de performance au niveau global. | ||
| - | * CAP intra-agent : Rétribution des inférences internes ou décisions d’un agent en fonction d’une action externe effectuée. | ||
| - | Une solution plus simple consiste à diviser la récompense globale entre tous les agents du système, mais ceci ne marche pas correctement dans les cas plus complexe qui nécessitent un feedback plus précis. | ||
| - | |||
| - | ===Caractéristiques de l’apprentissage décentralisé=== | ||
| - | |||
| - | Apprendre un comportement collectif total ciblé est compliqué. Il est possible de simplifier le problème en isolant les comportements appris de certains agents, en réduisant l' | ||
| - | Réduction de la complexité -> utiliser l' | ||
| - | |||
| - | ====Approches neuro-inspirée==== | ||
| - | |||
| - | Approche connexionniste : modélise les phénomènes mentaux ou comportementaux comme des processus émergents de réseaux d’unités simples interconnectées. | ||
| - | |||
| - | L'IA actuelle (systèmes experts, solveurs logiques, ...) exécute des algos, alors que l' | ||
| - | L' | ||
| - | |||
| - | Représentation invariante : régularité constante dans l' | ||
| - | |||
| - | ===Les approches connexionnistes dans le cadre de l’AmI=== | ||
| - | |||
| - | Le système ACHE (Adaptive Control of Home Environments) utilise les réseaux de neurone afin de gérer les dispositifs d'une maison. Le système se base sur une représentation d' | ||
| - | |||
| - | Problème de ce système : | ||
| - | * La connaissance acquise par les réseaux de neurones ne peut être utilisée que pour l' | ||
| - | * La connaissance est difficilement interprétable (pour l' | ||
| - | |||
| - | ===L’intelligence comme adaptation=== | ||
| - | |||
| - | En psychologie -> théorie constructiviste : le sujet construit sa vision du monde en agissant sur celui-ci. L' | ||
| - | |||
| - | ===Application en IA=== | ||
| - | |||
| - | L’approche traditionnelle peut être résumée comme cela : | ||
| - | - On part d’une tâche (connue par le concepteur) | ||
| - | - On conçoit une représentation spécifique pour cette tâche | ||
| - | - On crée un programme de résolution de la tâche qui utilise cette représentation | ||
| - | - On lance le programme sur la machine | ||
| - | L’approche développementale quant à elle se résume par ces étapes : | ||
| - | - On conçoit un corps adapté à l’environnement du robot | ||
| - | - On conçoit un programme de développement | ||
| - | - Initialement (à sa " | ||
| - | - Le robot apprend à partir de son expérience. | ||
| - | |||
| - | Caractéristiques des programmes développementaux : | ||
| - | * Ils ne sont pas spécifiques à une tâche | ||
| - | * Les tâches sont globalement inconnues à priori | ||
| - | * Il s’agît d’un apprentissage en temps réel | ||
| - | * C’est un apprentissage ouvert (open-ended) : l’apprentissage d’un concept offre la possibilité d’apprendre un nouveau concept | ||
| - | |||
| - | ===L’apprentissage sensorimoteur=== | ||
| - | |||
| - | Apprentissage sensorimoteur en premier lieu. Cet apprentissage doit permettre à l' | ||