Site Tools


Hotfix release available: 2025-05-14b "Librarian". upgrade now! [56.2] (what's this?)
Hotfix release available: 2025-05-14a "Librarian". upgrade now! [56.1] (what's this?)
New release available: 2025-05-14 "Librarian". upgrade now! [56] (what's this?)
Hotfix release available: 2024-02-06b "Kaos". upgrade now! [55.2] (what's this?)
Hotfix release available: 2024-02-06a "Kaos". upgrade now! [55.1] (what's this?)
New release available: 2024-02-06 "Kaos". upgrade now! [55] (what's this?)
Hotfix release available: 2023-04-04b "Jack Jackrum". upgrade now! [54.2] (what's this?)
Hotfix release available: 2023-04-04a "Jack Jackrum". upgrade now! [54.1] (what's this?)
New release available: 2023-04-04 "Jack Jackrum". upgrade now! [54] (what's this?)
Hotfix release available: 2022-07-31b "Igor". upgrade now! [53.1] (what's this?)
Hotfix release available: 2022-07-31a "Igor". upgrade now! [53] (what's this?)
New release available: 2022-07-31 "Igor". upgrade now! [52.2] (what's this?)
New release candidate 2 available: rc2022-06-26 "Igor". upgrade now! [52.1] (what's this?)
New release candidate available: 2022-06-26 "Igor". upgrade now! [52] (what's this?)
Hotfix release available: 2020-07-29a "Hogfather". upgrade now! [51.4] (what's this?)
compte-rendu-etat-art-these

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
compte-rendu-etat-art-these [2026/01/01 23:01]
66.118.142.156 old revision restored (2025/11/28 07:58)
compte-rendu-etat-art-these [2026/01/10 12:38] (current)
66.249.70.200 old revision restored (2025/08/31 01:45)
Line 1: Line 1:
 ===== Compte-rendu de l'état de l'art de la thèse de S. Mazac ===== ===== Compte-rendu de l'état de l'art de la thèse de S. Mazac =====
 +
 +==Types d’apprentissage artificiel==
 +   * Mémorisation par cœur (rote learning) : implémentation directe du savoir et des compétences, pas d’évolution.
 +   * Apprendre par instruction : transformation du savoir en représentation interne pour intégration au savoir préexistant.
 +   * Apprendre par l’exemple et par entrainement : à partir d’exemples positifs ou négatifs et expérience pratique.
 +   * Par analogie : extension d’un savoir d’un problème résolu vers un problème non résolu.
 +   * Par découverte : faire des observations, des expériences. Construire et tester des hypothèses et théories.
 +
 +==Caractéristiques de l’apprentissage pour les systèmes artificiels==
 +   * Apprentissage hors ligne (offline): la période d’apprentissage est préalable et indépendante à l’éxécution du programme.
 +   * Apprentissage en ligne (online): le programme apprend au cours de son activité.
 +   * Apprentissage par lots (batch learning): technique intermédiaire (des phases d’apprentissages offline à intervalle de temps régulier durant l’activité).
 +
 +====Principaux types d’apprentissage====
 +
 +===Apprentissage supervisé===
 +le feedback spécifie exactement l’activité désirée de l’apprenant. L’objectif de l’apprentissage est de s’y conformer le plus possible.
 +Permet l'apprentissage de concepts ciblés.
 +Exemple : Réseaux de neurones et reconnaissance d'images
 +
 +===Apprentissage non supervisé===
 +Pas de feedback explicite. L’objectif est de trouver les activités utiles et désirées sur la base du tâtonnement.
 +Recherche de points commun dans les données contextuellement à l'objectif fixé. Souvent basé sur le sstatistiques.
 +Exemple : ?
 +
 +===Apprentissage par récompense===
 +le feedback spécifie seulement l’utilité du comportement  par  une  valeur,  l’objectif  étant  de  la  maximiser.
 +
 +==Apprentissage par récompense (renforcement)==
 +Apprend un comportement par tatonnement. Recoit en entrée une perception, genère une action puis la valeur de cette action lui est passé.
 +Exemple : TPs Mif24 bras qui avance / robot qui sort du labyrinthe.
 +
 +==Apprentissage par récompense (Stochastique)==
 +Evaluer, selectionner, faire muter et recomencer juqu'à avoir une solution.
 +Exemple : Algo génétique
 +
 +
 +====L’apprentissage dans le cadre de l’AmI====
 +
 +===Les techniques de classification===
 +Efficace pour apprendre un concept ciblé dans un environnement maîtrisé.
 +Pas de capacité d'abstraction -> pas utilisable pour un agent autonome.
 +Exemple : Algorithme d'apprentissage supervisé basé sur des arbres de décisions
 +
 +===L’apprentissage par renforcement===
 +Difficilement utilisable pour l'AmI, car :
 +   -discrétisation du temps est faite de manière arbitraire
 +   -compliqué d'interpréter le feedback venant de l'utilisateur.
 +
 +Bilan : Besoin d'une approche plus globale ne se limitant pas à mettre en place des solutions pour des sous problèmes indépendants.
 +
 +===Exemple d’une approche globale===
 +Triplet de capteurs (O, M, C) [Objet, Mouvement, Contextuel],
 +Représentations définies sur un triplet (E, C, A) [Evenement, Condition, Action],
  
  
compte-rendu-etat-art-these.1767304874.txt.gz · Last modified: 2026/01/01 23:01 by 66.118.142.156