Tous Les Loulous
Smile
Bienvenue sur le forum Tous Les Loulous


Merci de vous connecter, ou de vous inscrire pour profiter au maximum du forum.

Merci pour votre participation !

Le forum de notre passion: le chien


Partagez | 
 

 Planning de renforcement

Voir le sujet précédent Voir le sujet suivant Aller en bas 
AuteurMessage
avatar
Angel
Loulou Maniac
Loulou Maniac
Messages : 9654
Date d'inscription : 12/06/2009
Humeur : Try to Kill my TV
MessageSujet: Planning de renforcement    Dim 1 Déc 2013 - 21:44

Planning de renforcement ?
reinforcement schedules
Shocked 

ça vous parle ?

Revenir en haut Aller en bas
avatar
Chana
Loulou Maniac
Loulou Maniac
Messages : 2588
Date d'inscription : 07/12/2010
MessageSujet: Re: Planning de renforcement    Dim 1 Déc 2013 - 21:53

Pas du tout, excepté en sport, mais ça doit pas être ça Razz 
Revenir en haut Aller en bas
avatar
Angel
Loulou Maniac
Loulou Maniac
Messages : 9654
Date d'inscription : 12/06/2009
Humeur : Try to Kill my TV
MessageSujet: Re: Planning de renforcement    Dim 1 Déc 2013 - 22:25

je ne sais pas trop ce dont quoi tu parles Chana ...
tu sais, moi et le sport^^
mdr mdr mdr

je suis dans la partie "comportement" là  
Revenir en haut Aller en bas
avatar
Françoise17
Da Boss
Da Boss
Messages : 1538
Date d'inscription : 05/12/2010
MessageSujet: Re: Planning de renforcement    Mar 3 Déc 2013 - 19:13

Donc tu parles du renforcement des "bonnes" manières qu'on veut de nos loulous?

Comme moi qui doit habituer les chiens à un nouveau chat???? Donc renforcement d'un comportement calme vis à vis du chat?
Revenir en haut Aller en bas
avatar
Angel
Loulou Maniac
Loulou Maniac
Messages : 9654
Date d'inscription : 12/06/2009
Humeur : Try to Kill my TV
MessageSujet: Re: Planning de renforcement    Mar 3 Déc 2013 - 23:04

je pense à des plannings d'apprentissage, ou "quand, comment, combien" une réponse du chien va engendrer une réponse de notre part.
Revenir en haut Aller en bas
avatar
Françoise17
Da Boss
Da Boss
Messages : 1538
Date d'inscription : 05/12/2010
MessageSujet: Re: Planning de renforcement    Mar 3 Déc 2013 - 23:45

Je suppose qu'une réponse du chien va engendrer une réponse de notre part, au moment ou nous ne sommes pas d'accord, nous voyons un danger, nous avons l'impression de devoir intervenir^^
Revenir en haut Aller en bas
avatar
Angel
Loulou Maniac
Loulou Maniac
Messages : 9654
Date d'inscription : 12/06/2009
Humeur : Try to Kill my TV
MessageSujet: Re: Planning de renforcement    Mer 4 Déc 2013 - 0:35

je restais dans les concepts d'apprentissage, en général Wink
récompense / punition - positive / négative. tout cela dans un planning. dans un but d'apprentissage.

l'apprentissage de notre notion de danger pour un chien...
c'est tellement vague comme ça, que je ne sais pas trop dire.
introduire ce 'danger', à dose minimum.
faire comprendre au chien que c'est dangereux.... ou faire comprendre au chien que l'on veut telle réponse quand ce danger se présente ? ou le laisser expérimenter par lui même, mais cela veut dire que quelque part il expérimente le danger en question....
je ne sais pas trop
Revenir en haut Aller en bas
avatar
Françoise17
Da Boss
Da Boss
Messages : 1538
Date d'inscription : 05/12/2010
MessageSujet: Re: Planning de renforcement    Mer 4 Déc 2013 - 13:10

Un truc tout bête: Quand j'ai eu mon premier chien, également un berger des pyrénées, j'étais très surprise par sa rapidité, tout le temps en mouvement etc. Et j'avais donc une trouille bleue qu'il se fasse ecraser un jour, malgré le fait que j'habitais dans la campagne profonde.

Donc, à chaque fois quand on croisait une voiture, je lui ai demandé assez tôt en ASSIS jusqu'à ce que le voiture était bien partie et je l'ai libéré avec un contre ordre.

Plustard il m'est arrivé lors d'une promenade que mon chien s'est assis sans raison. Et après il y avait une voiture qui avancait derrière une haie. Donc lui, il l'avait entendu (moi non) et il a fait ce qu'il a appris, un ASSIS^^

J'ai adoré!!!!
Revenir en haut Aller en bas
avatar
Angel
Loulou Maniac
Loulou Maniac
Messages : 9654
Date d'inscription : 12/06/2009
Humeur : Try to Kill my TV
MessageSujet: Re: Planning de renforcement    Jeu 5 Déc 2013 - 1:24

Ha ben oui ^^
le conditionnement bruit de voiture --> assis a bien été assimilé lol Laughing
par contre, pour moi, il n'avait pas spécialement appris qu'il y avait éventuellement un danger à l'approche d'une voiture.
juste une solide association Wink

et c'est un peu ce que je voulais aborder en parlant de ces "reinforcement schedules" - planning de renforcement

Revenir en haut Aller en bas
avatar
Angel
Loulou Maniac
Loulou Maniac
Messages : 9654
Date d'inscription : 12/06/2009
Humeur : Try to Kill my TV
MessageSujet: Re: Planning de renforcement    Sam 14 Déc 2013 - 22:10

Planning de renforcement
Issus de Pamela Reid - Excel-Erated Learning

http://touslesloulous.forumactif.com/t1988-excel-erated-learning-pamela-reid


Un planning de renforcement est un programme ou une règle qui détermine comment et quand une réponse sera suivi par une récompense. Quand le chien répond, est ce que cela doit-il toujours suivi d'une friandise ou d'un click ? Cela va dépendre de l'étape d'apprentissage. Cela va dépendre spécifiquement si le chien a appris la relation entre la réponse et la conséquence. C'est important car le planning de renforcement va influencer comment la réponse est apprise et comment la réponse est maintenue. Le planning ne sera pas le même pour ces deux choses.

---
Les différents types de planning (les acronymes sont sur la base des mots en anglais^^)

1. Planning de renforcement continu (CRF): chaque survenue de la réponse est suivi d'un renforcement.
2. Planning de renforcement partiel ou intermittent (PRF): la réponse est renforcée seulement après certaines réponses. Cela peut être fait avec un ratio fixe (FR), un ratio variable (VR), un ratio aléatoire (RR), à intervalle fixe (FI), ou à intervalle variable (VI).
3. Planning de renforcement différentiel : seulement certaines vitesses de réponse ou certains types de réponses sont renforcés.
- avec un planning différentiel de vitesse, que la réponse soit récompensée ou non, dépend de la vitesse d'arrivée de cette réponse. On peut avoir des vitesses rapides (DRH), et des vitesses lentes (DRL).
- avec un planning différentiel de type, que la réponse soit récompensée ou non, dépend de la qualité de cette réponse. Cela peut être fait des comportements excellents (DRE), mais aussi avec des comportements incompatibles (DRI) et avec d'autres comportement (DRO)
4. Planning de renforcement sur la durée : la réponse doit être maintenu pendant un certain temps pour que le renforcement soit aquis.  Ca peut être une durée fixe (FD) ou une durée aléatoire (RD)

On peut parler aussi de 2 situations :
- les essais séparés ("discrete trials"): on demande à un chien de faire une chose et le chien est recompensé pour cela. Le chien ne répond pas de sa propre initiative. Par exemple, le chien s'assoit plein de fois, mais vous ne récompensez que ceux qui sont un résultat de votre demande.  Et là, il faut le faire aléatoirement. Le chien anticipe, et c'est ce qui le fait aller plus vite dans ses comportements.

- les essais 'libre' ("Free") : l'animal est libre de répondre comme il veut.
(Marrant : tous les planning de renforcement expliqués plus haut ont été étudié en situation de essai libre^^)
Votre chien pourrait ramener son apportable constamment si on lui en donne la possibilité, mais vous le lancez seulement si vous voulez qu'il vous le ramène. Durant la marche au pied, il y a des comportements qui se font car vous les demandez : assis, changement de vitesse, halte, tourne... Cependant le chien est aussi récompensé pour son contact visuel  avec vous ("eyes contact"), et ça, on l'attend du chien sans même lui dire. La fréquence du contact visuel est un exemple d'un comportement "libre".  

---
Quelques explications supplémentaires :

- Avec un planning de renforcement continu (CRF), chaque réponse est suivie d'une récompense. C'est le meilleur des planning à utiliser lors du premier enseignement d'un nouveau comportement. Un animal sous un planning CRF va répondre avec une vitesse stable et modéré avec des pauses brèves et imprévisibles. Les réponses diminuent graduellement quand l'animal arrive à satiété du renforcateur.

- Avec un planning à rapport fixe de renforcement (FR), il y a un rapport fixe entre le nombre de réponse réalisée et le nombre de récompense. Avec un planning de type FR-5, l'animal devra faire 5 fois le comportement avant de recevoir une récompense. Un planning à rapport fixe de renforcement  FR-1 (1 comportement = 1 récompense) est un planning de renforcement continu (CRF) Wink.
Un animal sous un planning FR répond à une vitesse élevée et stable, sauf juste après le renforcement. C'est ce qui est appelé la pause post-renforcement. Plus il aura à faire de réponses avant la récompense, plus longue sera la pause.

- Avec un planning à rapport variable de renforcement (VR), le nombre de réponses requis pour avoir un renforcement varie d'une fois sur l'autre. Avec un planning VR-5, l'animal devra, en moyenne, repondre 5 fois avant d'être renforcé.
Avec un planning de type VR, l'animal répond à une vitesse élevée et stable, avec un minimum de pause.
Les machines à sous nous font fonctionner sur ce modèle. Les commerciaux travaillent aussi sur ce modèle de renforcement à rapport variable.
les chances de succès sont présentes à chaque réponse qui est faite; et plus il y a de réponses, plus il y aura de récompenses.

- Avec un planning à intervalle fixe de renforcement (FI), une récompense est donnée seulement si une réponse est produite après un intervalle de temps donné. Avec un planning FI-5, l'animal est récompensé pour la première réponse qui se produit après 5 secondes. Si la réponse est produite après 2 secondes, rien ne se passe, mais si elle se produit après 6 secondes, une récompense est donnée. Notez qu'il ne faut pas juste attendre ! il faut qu'une réponse soit donnée! Il faut donc attendre avant qu'une réponse soit récompensée.

- Avec un planning à intervalle variable de renforcement (VI), l'intervalle requis avant la récompense varie. Il faut en moyenne attendre x secondes. Comme dans le cas du VR, cela conduit à des vitesses de réponses stables et sans pause.
Le plus difficile est de déterminer le temps qu'il faut laisser couler avant de recommencer un cycle. Mais du fait de ce dernier temps, les réponses ont tendance à se répéter.
Un exemple de ce type de planning est la cafétéria des étudiants : elle est ouverte dans un intervalle de temps donné, mais avant ou après, c'est trop tard !

Un petit diagramme qui reprend un peu tout cela :


---
Les planning différentiel de renforcement sont un peu différents.

- Les planning différentiels de vitesse requièrent que l'animal réponde à une certaine vitesse pour obtenir un renforcement. Répondre avant 5 secondes par exemple. Ce n'est pas vraiment utilisé dans des situations d'entrainement

- les planning différentiel de type requièrent que la réponse doit être d'une certaine qualité pour que le renforcement soit donné. Ce type de planning est souvent utilisé pour encourager les comportements appropriés, en éliminant en même temps les comportements non voulus.
Par exemple, si votre chien aime vous sauter dessus, vous pouvez le mettre sous ce type de planning en ne renforçant que soit les réponses qui ne peuvent pas lui permettre de sauter (comportement incompatible avec le saut : assis par exemple), soit tout autre comportement. En renforçant uniquement ces comportements alternatifs, vous les forcez à apparaître plus souvent, et le saut sur vous aura tendance à disparaitre, simplement car le chien ne peut pas faire les 2 ensemble.
Un des buts finaux de ce type de planning peut être de ne récompenser que les réponses excellentes. Beaucoup de réponses peuvent varier en qualité : un assis peut être plus rapide, etc... Plutôt que de renforcer aléatoirement  ces réponses, il peut être malin de renforcer ces réponses de façon différentielle, et donc de ne renforcer que celle qui se rapproche de votre perfection.
Ce serait une sorte de 'jackpot' pour l'excellence... même si vous devriez travailler comme ceci avec tout les renforcements ^^ Mais bien sur, ce que nous devons considérer comme excellant va dépendre du niveau d'apprentissage. Quand on acquière un nouveau comportement, toutes les réponses sont excellentes. Au fur et à mesure de l'apprentissage, vous devez redéfinir vos critères d'excellence.

---
Quel planning de renforcement devons nous utiliser ?
Pour l'apprentissage d'un nouveau comportement, il est très efficace d'utiliser un planning de renforcement continu (CRF) comme chaque réponse est récompensée. Une fois que le chien montre que l'association entre la réponse et la récompense est bien comprise, vous devez passer sur un planning intermittent.

Comment savoir quand la réponse est apprise ?
La 'Vérité' dans tout cela va dépendre du comportement en question, et des réponses du chien... Attention de ne pas maintenir un planning CRF trop longtemps : il sera plus dur de passer alors sur un planning intermittent, et cela risque d'être pris comme une punition...  Il faut mieux changer le type de planning trop tôt : le chien, et ses réponses, vous diront si c'est OK. Il faut prendre des risques, mais rester flexible ! Quitte à revenir en arrière.

Comment savoir quel type de planning intermittent utilisé ?
Pour une réponse "tout ou rien" : un planning à rapport aléatoire ou à rapport variable
Pour des réponses plus compliquées : un planning différentiel sur l'excellence
Pour éliminer certains comportements : des plannings différentiels type DRL, DRO et DRI


Dernière édition par Angel le Lun 16 Déc 2013 - 22:45, édité 1 fois
Revenir en haut Aller en bas
avatar
Angel
Loulou Maniac
Loulou Maniac
Messages : 9654
Date d'inscription : 12/06/2009
Humeur : Try to Kill my TV
MessageSujet: Re: Planning de renforcement    Sam 14 Déc 2013 - 22:12

j'ai voulu faire un truc simple !


c'est l'horreur ce truc


un petit lien en GB de Ian Dunbar quand même ^^
http://www.dogstardaily.com/blogs/reinforcement-schedules
Revenir en haut Aller en bas
avatar
Angel
Loulou Maniac
Loulou Maniac
Messages : 9654
Date d'inscription : 12/06/2009
Humeur : Try to Kill my TV
MessageSujet: Re: Planning de renforcement    Ven 22 Aoû 2014 - 23:39


Sur son blog  http://www.magicclicker.ch, Cynthia Edelman-Rota nous explique un peu ces schémas de renforcement. Un peu beaucoup mieux écrit que ma traduction/adaptation ^^

http://www.magicclicker.ch/renforcement-extinction/

MagicClicker a écrit:

Renforcement et extinction


Ce qu’on appelle « l’extinction » d’un comportement c’est sa cessation (en clair : le fait qu’un comportement disparaisse, cesse, s’arrête définitivement); la psychologie du comportement nous apprend qu’un renforcement intermittent (qui n’arrive pas à chaque fois que le comportement se produit) rend cette extinction infiniment plus improbable.

Voyons ça de plus près…  ;-)

Dans leurs expériences avec les rats, les scientifiques décident d’un schéma de renforcement : une récompense arrive tous les 15 (ou 20 ou 50) bons comportements ou toutes les deux minutes ou parfois toutes les deux réponses réussies, puis toutes les sept ou toute les dix fois. Ou encore, quand le chercheur est présent dans la pièce uniquement et rien quand il est absent… dans tous les cas de figure, la récompense n’arrive pas à chaque essai mené à bien. N’importe quel schéma qui ne renforce pas toutes les réponses correctes est défini comme « intermittent ».

Exemple de la vie courante : quand un enfant réclame un bonbon avant le repas et qu’on le lui refuse dix fois et que — parce qu’on est fatigué et qu’on n’a pas envie d’assumer la partie explications déjà données cent fois — on le lui accorde la onzième… on a mis en place un schéma de renforcement intermittent : on peut être certain que l’enfant redemandera encore cent fois, en espérant voir réapparaître l’exception ;-)

Revenons au chien… :-D

Le contraire d’un renforcement intermittent est un renforcement continu…  en clair (bis), à chaque fois que votre chien produit un comportement, revient vers vous par exemple, il reçoit une friandise – toujours et invariablement (c’est le schéma de renforcement le plus efficace en apprentissage). Il est évident qu’un chien qui voit apparaître sa friandise à chaque rappel, s’apercevra très vite de la différence si celle-ci n’arrive plus du tout… et le comportement s’éteindra relativement vite. Tout ou rien, c’est facile à différencier.

A contrario, quel que soit le schéma « intermittent »,  celui-ci complique la tâche pour l’animal : il ne peut pas, ou difficilement, déterminer si et quand une récompense va arriver… il va donc continuer d’essayer en espérant voir arriver le renforcement (l’espoir fait vivre ou le principe de la machine à sous… on joue, on joue car une fois on a gagné).

Avec tout schéma de renforcement intermittent…. l’extinction aura beaucoup de peine à se faire - la période sans renforcement peut durer longtemps : l’animal s’habitue à des périodes (parfois longues) sans renforcement…

A nous, d’utiliser ce schéma de renforcement intermittent (post période d’apprentissage) pour renforcer certains comportements que l’on souhaite voir échapper à l’extinction (comme le rappel notamment), en récompensant de temps en temps ce comportement,  pendant toute la vie du chien.

A nous d’en prendre également conscience quand nous souhaitons voir arriver l’extinction d’un comportement quel qu’il soit (quémander à table, par exemple) : tout relâchement à votre ligne de conduite, aussi rare soit-il, vous catapulte dans un schéma de renforcement intermittent et donc contribue à faire perdurer le comportement, à le rendre hyper résistant à l’extinction.

   En résumé : en période apprentissage — récompensez chaque réponse correcte.
   Pour voir perdurer un comportement — renforcez de manière intermittente.
   Pour voir disparaître un comportement — ne le renforcez plus jamais (ou gérez l’environnement afin de rendre ce renforcement impossible).

Et ne vous étonnez plus de voir ce qui marche « de temps en temps » s’installer solidement ou de voir ce qui n’est plus jamais récompensé, s’éteindre :-D
Revenir en haut Aller en bas

Contenu sponsorisé

MessageSujet: Re: Planning de renforcement    

Revenir en haut Aller en bas
 

Planning de renforcement

Voir le sujet précédent Voir le sujet suivant Revenir en haut 

 Sujets similaires

+


Page 1 sur 1

Permission de ce forum:Vous ne pouvez pas répondre aux sujets dans ce forum
Tous Les Loulous :: Discussions canines :: Comportement du chien : Parlez-vous chien ?-
Sauter vers: