DokuWiki

You've loaded an old revision of the document! If you save it, you will create a new version with this data.

<h2>Compte-rendu de l'état de l'art de la thèse de S. Mazac</h2>
<div class="level2">

</div>

<h5>Types d’apprentissage artificiel</h5>
<div class="level5">
<ul>
<li class="level1"> Mémorisation par cœur (rote learning) : implémentation directe du savoir et des compétences, pas d’évolution.</li>
<li class="level1"> Apprendre par instruction : transformation du savoir en représentation interne pour intégration au savoir préexistant.</li>
<li class="level1"> Apprendre par l’exemple et par entrainement : à partir d’exemples positifs ou négatifs et expérience pratique.</li>
<li class="level1"> Par analogie : extension d’un savoir d’un problème résolu vers un problème non résolu.</li>
<li class="level1"> Par découverte : faire des observations, des expériences. Construire et tester des hypothèses et théories.</li>
</ul>

</div>

<h5>Caractéristiques de l’apprentissage pour les systèmes artificiels</h5>
<div class="level5">
<ul>
<li class="level1"> Apprentissage hors ligne (offline): la période d’apprentissage est préalable et indépendante à l’éxécution du programme.</li>
<li class="level1"> Apprentissage en ligne (online): le programme apprend au cours de son activité.</li>
<li class="level1"> Apprentissage par lots (batch learning): technique intermédiaire (des phases d’apprentissages offline à intervalle de temps régulier durant l’activité).</li>
</ul>

</div>

<h3>Principaux types d’apprentissage</h3>
<div class="level3">

</div>

<h4>Apprentissage supervisé</h4>
<div class="level4">

<p>
le feedback spécifie exactement l’activité désirée de l’apprenant. L’objectif de l’apprentissage est de s’y conformer le plus possible.
Permet l'apprentissage de concepts ciblés.
Exemple : Réseaux de neurones et reconnaissance d'images
</p>

</div>

<h4>Apprentissage non supervisé</h4>
<div class="level4">

<p>
Pas de feedback explicite. L’objectif est de trouver les activités utiles et désirées sur la base du tâtonnement.
Recherche de points commun dans les données contextuellement à l'objectif fixé. Souvent basé sur le sstatistiques.
Exemple : ?
</p>

</div>

<h4>Apprentissage par récompense</h4>
<div class="level4">

<p>
le feedback spécifie seulement l’utilité du comportement  par  une  valeur,  l’objectif  étant  de  la  maximiser.
</p>

</div>

<h5>Apprentissage par récompense (renforcement)</h5>
<div class="level5">

<p>
Apprend un comportement par tatonnement. Recoit en entrée une perception, genère une action puis la valeur de cette action lui est passé.
Exemple : TPs Mif24 bras qui avance / robot qui sort du labyrinthe.
</p>

</div>

<h5>Apprentissage par récompense (Stochastique)</h5>
<div class="level5">

<p>
Evaluer, selectionner, faire muter et recomencer juqu'à avoir une solution.
Exemple : Algo génétique
</p>

</div>

<h3>L’apprentissage dans le cadre de l’AmI</h3>
<div class="level3">

</div>

<h4>Les techniques de classification</h4>
<div class="level4">

<p>
Efficace pour apprendre un concept ciblé dans un environnement maîtrisé.
Pas de capacité d'abstraction -> pas utilisable pour un agent autonome.
Exemple : Algorithme d'apprentissage supervisé basé sur des arbres de décisions
</p>

</div>

<h4>L’apprentissage par renforcement</h4>
<div class="level4">

<p>
Difficilement utilisable pour l'AmI, car :
</p>
<ol>
<li class="level1">>discrétisation du temps est faite de manière arbitraire</li>
<li class="level1">>compliqué d'interpréter le feedback venant de l'utilisateur.</li>
</ol>

</div>

Enable Complex Tables Editor Height px Turn supplementary image paste support on

Edit summary: Minor changes

Please fill all the letters into the box to prove you're human. W N O V W Please keep this field empty:

DokuWiki

Site Tools

Page Tools