O que são horários diferenciais de reforço no treinamento de cães?
O que exatamente são os cronogramas de reforço diferencial? Como mencionado no meu artigo sobre os quatro quadrantes do treinamento de cães, o reforço positivo é o que - na minha opinião - funciona melhor quando se trata de treinamento de cães. Nesse artigo, vimos um vídeo de como o reforço positivo instiga entusiasmo no cão quando comparado ao reforço negativo. Hoje, gostaria de abordar a variedade de tipos de reforço à sua disposição para treinar seu cão.
A beleza desses métodos de treinamento é que o reforço direciona o comportamento e você, como treinador, faz com que todas essas grandes coisas aconteçam para o seu cão. É inevitável que o vínculo entre dono e cachorro se fortaleça enquanto eles trabalham juntos como uma equipe. Quando começo as aulas, muitas vezes cão e dono são apenas duas entidades separadas que levam suas próprias vidas - não acontecendo muito por lá. No final da aula, a maior satisfação é ver o início de um vínculo.
É esse vínculo que faz com que o treinamento através de reforço positivo valha a pena, e o que realmente me faz sentir como se tivesse feito um bom trabalho em ajudar os cães e seus donos. A seguir, são apresentados diferentes tipos de esquemas de reforço diferencial que você pode usar ao treinar seu cão.
4 Tipos de Reforço Diferencial
Nos cronogramas de reforço diferencial, você costuma levar o treinamento para o próximo nível. Você pode ter ensinado seu cão a se sentar usando reforço positivo, mas o treinamento não pára por aí. Inicialmente, para ajudar seu cão, você pode ter lhe dado um petisco toda vez que ele se sentou. Agora que seu cão começa a entender o que você quer, você pode começar a dar as guloseimas de vez em quando, e é aí que você começa a ficar exigente. Você precisa comprovar o comportamento e torná-lo mais confiável.
Quando você usa esses métodos, basicamente escolhe quais comportamentos reforçar e quais não. Isso significa que você estará fornecendo reforço positivo para os comportamentos que você gosta (você dá um tratamento para que o comportamento se repita) e você está dando punição negativa para os comportamentos que você não gosta (você não dá o tratamento, então o comportamento termina).
Isso está de acordo com o novo termo de Skinner na Lei do Efeito de Thorndike, que afirma que: "O comportamento reforçado tende a ser repetido (isto é, fortalecido); o comportamento não reforçado tende a desaparecer - ou a ser extinto (enfraquecido)". Vamos dar uma olhada nesses cronogramas de reforço diferencial.
1. Reforço diferencial de comportamentos incompatíveis (DRI)
Este método de treinamento é útil na modificação do comportamento do cão sem força. Eu uso muito isso quando lida com casos de agressão. Basicamente, nesta programação, você reforçará apenas comportamentos incompatíveis com o comportamento indesejado. O que isso significa é que um cachorro que pula não pode pular se estiver sentado bem com as quatro patas no chão. No caso de um cachorro que morde, o cão não pode morder se lhe for pedido para levar um brinquedo na boca. No comportamento agressivo, um cão não pode estourar se lhe for pedido que se ajeite bem e seja generosamente recompensado por isso.
Nesse cronograma, encontraremos um comportamento incompatível, treiná-lo sistematicamente em um ambiente controlado e recompensá-lo generosamente, para que o cão se sinta mais compelido a executar o comportamento incompatível e faça boas escolhas.
2. Reforço diferencial de comportamentos alternativos (DRA)
Às vezes, não é tão fácil encontrar um comportamento incompatível; Nesse caso, um comportamento alternativo funcionará. Nesse caso, você reforçará o comportamento alternativo desejado e ignorará o indesejado. Isso deve resultar na teoria de Skinner, em que "o comportamento reforçado tende a ser repetido (ou seja, fortalecido); o comportamento não reforçado tende a desaparecer - ou ser extinto".
Obviamente, é melhor minimizar as chances de o cão ensaiar o comportamento indesejado. É melhor, portanto, trabalhar com o cachorro abaixo do limite. O comportamento alternativo, neste caso, dá ao cão algo para se concentrar, de modo a não se envolver em comportamentos indesejados.
3. Reforço Diferencial de Outros Comportamentos (DRO)
Nesse caso, quaisquer outros comportamentos que não sejam indesejados são reforçados. Em outras palavras, você não tem um comportamento-alvo específico em mente, como no treinamento com clickers. Então, diga que o seu cachorro pula, você recompensaria outros comportamentos além do comportamento de pular. Isso deixa você com bastante variedade! Acho essa técnica útil nos casos em que o cão precisa desse incentivo extra para começar. É útil para cães adotivos ou cães que não têm histórico de treinamento e o treinamento é muito novo para eles.
4. Reforço diferencial de excelente comportamento (DRE)
É aqui que você começa a ficar exigente quando está treinando. Basicamente, quando seu cão aprende bem um novo comando, você começa a reforçar apenas os excelentes comportamentos que mais o impressionam. Por exemplo, digamos que seu cão sabe bem como se sentar, mas faz isso bem devagar; nesse caso, você começará a reforçar apenas aqueles que são um pouco mais rápidos que os outros. Isso eleva seu treinamento a um nível totalmente novo e é um ótimo método se você pratica o treinamento de precisão necessário para competir em obediência.
Um exemplo de DRI (Kaiser e Petra não podem correr para fora se sentados e ficando)
Referências
- McLeod, SA (2007). BF Skinner. Condicionamento operante. Recuperado em http://www.simplypsychology.org/operant-conditioning.html
- A pasta de trabalho de agressão canina; James O'Heare Dip.CB