Rinforzo negativo: come sostituire un oggetto?


18

Il mio Beauce Shepherd ora ha 9 mesi, abbiamo seguito alcune lezioni di educazione comportamentale con un personal trainer e tutto è andato molto bene. Prima che il cane facesse quello che voleva e ora ascolta davvero bene!

Su suggerimento del formatore, alcuni comportamenti sono stati rafforzati positivamente e altri negativamente. Il problema che stiamo avendo ora è con i comportamenti che abbiamo rafforzato negativamente. Stiamo usando una scatola di metallo per emettere un suono, il cane lo odia e obbedisce. Viene sempre utilizzato dopo un "no" come seconda sanzione. Tutto funziona perfettamente e ora non abbiamo più bisogno di usare la scatola perché si comporta correttamente.

Il problema è che pensiamo che dovremo sostituire la scatola con qualcos'altro poiché ora ha imparato che se non abbiamo la scatola, non ci sarà alcun suono e quindi si impegna nel comportamento indesiderato. Sta iniziando a essere un problema poiché ora dobbiamo portare la scatola dappertutto, perché se non ce l'abbiamo userà l'opportunità.

Esiste un modo per correggere questo problema sostituendo la scatola con il nostro corpo o qualcosa del genere?

Nota: è stato deselezionato un mese fa e ci sta sfidando un po 'meno, ma lo fa ancora quando non abbiamo la scatola a portata di mano.

Grazie


1
Probabilmente dovresti porre al tuo allenatore questa domanda, ma una volta che il rinforzo negativo (scatola di metallo) ha lavorato per frenare il suo comportamento indesiderato, non dovresti ora iniziare a rafforzare i buoni comportamenti? Ad esempio, se il mio cane continuasse a salire sul divano, potrei (1) scuotere la scatola di metallo per scoraggiarlo, e poi una volta che avesse imparato ad andare sul divano era indesiderato, avrei (2) elogiato e trattato generosamente ogni volta che lui disteso sul pavimento vicino al divano o simile.
Steve D,

1
:) Adoro come i cani possano imparare queste cose da soli, dopo qualche osservazione ... "nessuna scatola, ehi, posso fare quello che voglio!" :) :) :)
woliveirajr

Risposte:


10

Ogni volta che si parla di condizionamento operante aiuta a parlare la stessa lingua:

  • Rinforzo: un'azione progettata per aumentare la frequenza di un comportamento
  • Punizione: un'azione progettata per ridurre la frequenza di un comportamento
  • Positivo: presenza di uno stimolo
  • Negativo: assenza di uno stimolo

Questi termini possono formare quattro diverse combinazioni ( NB: gli esempi tra parentesi sono esempi, non consigli!):

  • Rinforzo positivo: presentare uno stimolo per aumentare la frequenza di un comportamento (ad es. Dare una sorpresa quando il cane è seduto a comando)
  • Rinforzo negativo: rimuovere uno stimolo per aumentare la frequenza di un comportamento (ad es. Il postino se ne va dopo che il cane abbaia contro di esso)
  • Punizione positiva: presentare uno stimolo per ridurre la frequenza di un comportamento (ad esempio colpire il cane quando viene urinato sul tappeto)
  • Punizione negativa: rimuovi uno stimolo per ridurre la frequenza di un comportamento (es. Lascia la stanza quando il cane ti salta addosso)

In pratica, questi possono confondersi. Ad esempio, fare rumore con la scatola è uno stimolo progettato per ridurre la frequenza di un comportamento, quindi è tecnicamente un esempio di punizione positiva, ma se si interrompe il rumore una volta che il cane compie il comportamento corretto, si rimuove anche uno stimolo a aumentare la frequenza del comportamento corretto, hey presto !, rinforzo negativo.

Ma ciò presuppone che il tuo cane abbia un comportamento corretto da eseguire. Non si specifica quale sia il comportamento indesiderato o se esiste un comportamento alternativo desiderato che si sta tentando di rafforzare. Se tutto ciò che fai con il rumore sta cercando di impedirgli di fare qualcosa, allora stai fornendo punizione piuttosto che rinforzo negativo.

In entrambi i casi, parte del tuo problema è probabilmente che stai usando solo rinforzi e punitori primari , cioè quelli che il cane non ha bisogno di imparare. Il cibo, ad esempio, è un rinforzo primario. Il cane sa che il cibo è una buona cosa senza doverlo imparare. Per estensione, il rumore è un punitore primario, poiché è scomodo per il cane sentire. I rinforzi e i punitori secondari , al contrario, sono quelli che il cane ha imparato.

L'esempio classico è la campana di Pavlov che suona ogni volta che fornisce cibo al cane. Abbinando costantemente un rinforzo primario con uno stimolo, lo stimolo può iniziare a fungere da rinforzo secondario. Cioè, il cane apprende che la campana segnala l'arrivo del cibo e reagirà di conseguenza.

Dici che usi la parola "no" (si spera in una voce severa, i cani sono abbastanza abili nelle intonazioni esigenti) quando dicono il tuo cane, insieme al rumore. Il "no" dovrebbe fungere da punitore secondario, allo stesso modo in cui lode può funzionare come rinforzo secondario. Ma probabilmente non sei riuscito a eliminare gradualmente il rumore vero e proprio, iniziando a volte a dire solo "no" ma a non fare il rumore.

Il problema è che, ormai, il tuo cane si è reso conto del fatto che "no" senza scatola intorno significa nessun punitore primario, cioè i due non sono imparentati, e quindi è salvo quando non è in giro.

Ti suggerisco di aprire una nuova domanda che descrive i comportamenti effettivi che desideri scoraggiare e che potremmo essere più in grado di aiutarti a trovare un modo utilizzando l'intero spettro delle condizioni operative per far sì che il tuo cane apprenda ciò che desideri fare.


5

@ThomasH è un'ottima risposta e tocca la questione dell'utilizzo di punitori secondari in modo molto preciso.

Qui sto solo aggiungendo alcuni commenti su due aspetti del problema.

Punire il comportamento sbagliato vs. rafforzare il comportamento corretto

Anche se la "teoria" funziona allo stesso modo sul "lato rinforzo" e sul "lato punitore" e gli effetti possono essere altrettanto efficaci, non dobbiamo dimenticare che sopprimere un comportamento non insegna al cane cosa fare invece e concentrarsi principalmente su la parte "no" dell'addestramento porta al microgestione : devi costantemente insegnare al cane cosa non dovrebbe fare. Anche se il cane impara che non dovrebbe fare X in una determinata situazione, è comunque libero di eseguire Y, Z, ecc. Se gli insegni positivamente (rafforzalo) invece di fare W, ciò probabilmente fermerà una sorta di circolo vizioso e rendere tutti felici.

Rinforzo / punizione a tasso variabile

@ThomasH ha spiegato il concetto di rinforzo secondario o punizione.

Un aspetto da tenere presente è che, contrariamente ai rinforzi / alle punizioni primarie, quelle secondarie devono essere ricompensate (in un modo o nell'altro) utilizzando un programma variabile .

Il cibo è un rinforzo primario. Ogni volta che il cane riceve un pezzo di cibo, viene rinforzato.

Ma una parola chiave come "sì" o un clic può diventare un rinforzo secondario. È collegato a un rinforzo primario successivo. Il punto chiave è che funziona perché il cane ha imparato che il rinforzo secondario è ricompensato, dal rinforzo primario. Una volta appreso questo, il collegamento deve essere mantenuto con i premi effettivi. All'inizio (durante l'allenamento) la ricompensa arriverà ogni volta, quindi potrà essere ricompensata con un programma variabile. Il programma variabile in realtà sta rafforzando il collegamento in quanto il cane non può prevedere quando arriverà la ricompensa principale.

Si noti che questo di solito viene applicato ai rinforzi terziari : l'indicazione "sit" è in realtà un rinforzo, in quanto può portare a un altro rinforzo (un clic per esempio) che quindi porta a una ricompensa effettiva.

Di solito non dissociamo mai il rinforzo secondario (il clic) dal rinforzo primario (ad esempio la ricompensa del cibo). Ciò mantiene il legame tra i due estremamente forte e il tasso variabile viene applicato tra l'indicatore (rinforzo terziario) e il clic.

Tuttavia, nel caso delle punizioni non si ha una vera "punizione terziaria", quindi il tasso variabile di "rinforzo" (inteso come punizione in questo caso) è tra la punizione secondaria ("no") e la punizione effettiva ( la scatola).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.