DokuWiki

This is an old revision of the document!

Compte-rendu de l'état de l'art de la thèse de S. Mazac

Types d’apprentissage artificiel

Mémorisation par cœur (rote learning) : implémentation directe du savoir et des compétences, pas d’évolution.
Apprendre par instruction : transformation du savoir en représentation interne pour intégration au savoir préexistant.
Apprendre par l’exemple et par entrainement : à partir d’exemples positifs ou négatifs et expérience pratique.
Par analogie : extension d’un savoir d’un problème résolu vers un problème non résolu.
Par découverte : faire des observations, des expériences. Construire et tester des hypothèses et théories.

Caractéristiques de l’apprentissage pour les systèmes artificiels

Apprentissage hors ligne (offline): la période d’apprentissage est préalable et indépendante à l’éxécution du programme.
Apprentissage en ligne (online): le programme apprend au cours de son activité.
Apprentissage par lots (batch learning): technique intermédiaire (des phases d’apprentissages offline à intervalle de temps régulier durant l’activité).

Principaux types d’apprentissage

Apprentissage supervisé

le feedback spécifie exactement l’activité désirée de l’apprenant. L’objectif de l’apprentissage est de s’y conformer le plus possible. Permet l'apprentissage de concepts ciblés. Exemple : Réseaux de neurones et reconnaissance d'images

Apprentissage non supervisé

Pas de feedback explicite. L’objectif est de trouver les activités utiles et désirées sur la base du tâtonnement. Recherche de points commun dans les données contextuellement à l'objectif fixé. Souvent basé sur le sstatistiques. Exemple : ?

Apprentissage par récompense

le feedback spécifie seulement l’utilité du comportement par une valeur, l’objectif étant de la maximiser.

Apprentissage par récompense (renforcement)

Apprend un comportement par tatonnement. Recoit en entrée une perception, genère une action puis la valeur de cette action lui est passé. Exemple : TPs Mif24 bras qui avance / robot qui sort du labyrinthe.

Apprentissage par récompense (Stochastique)

Evaluer, selectionner, faire muter et recomencer juqu'à avoir une solution. Exemple : Algo génétique