Outils pour utilisateurs

Outils du site


sciences:ia:apprentissage-par-renforcement

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Prochaine révision
Révision précédente
sciences:ia:apprentissage-par-renforcement [2018/06/22 08:19] – créée yoannsciences:ia:apprentissage-par-renforcement [2021/02/01 21:51] (Version actuelle) – modification externe 127.0.0.1
Ligne 3: Ligne 3:
 ====== Apprentissage par renforcement ====== ====== Apprentissage par renforcement ======
  
-L'apprentissage par renforcement (reinforcement learning) s'inspire du comportement animal (bio mimétique) avec une approche par essais/erreurs et mémorisation des actions passées. On met en œuvre cette méthode d'apprentissage dans les cas où l'on n'a pas connaissance de ce qu'il faudrait faire.+L'apprentissage par renforcement (reinforcement learning) s'inspire du comportement animal (bio mimétique) avec une approche par essais/erreurs et mémorisation des actions passées. On met en œuvre cette méthode d'apprentissage dans les cas où l'on n'a pas connaissance de ce qu'il faudrait faire. L'agent interagit avec l'environnement, note ses actions et tire des conclusions pour les actions futures. Trois variables permettent de décrire ces interactions: l'état, l'action, la récompense. 
 + 
 +Lors de la phase d'apprentissage, il est nécessaire d'essayer un grand nombre de possibilité choisies aléatoirement: c'est l'exploration.
    
  
-L'agent apprend en interagissant avec l'environnement+ ===== Références ===== 
 + 
 +  * GLM 216, L'apprentissage par renforcement pour créer des bots autonomes. 
sciences/ia/apprentissage-par-renforcement.1529655577.txt.gz · Dernière modification : 2021/02/01 21:51 (modification externe)