Os quatro quadrantes do treinamento de cães
Se você nunca ouviu falar sobre os quatro quadrantes do treinamento de cães, não precisa se preocupar; provavelmente você os usa o tempo todo quando treina seu cão ou trabalha na modificação de comportamento. Você não precisa ser um treinador de cães certificado ou treinar golfinhos no mundo do mar para aprender a dinâmica - basta entender como os cães reagem ao ambiente e como o ambiente o afeta.
Neste artigo, tentarei o meu melhor para explicar esses quadrantes de uma maneira fácil de entender. Na maioria dos livros que tenho usado linguagem muito técnica, as coisas parecem confusas e obscuras quando não precisam.
Nota: Em termos de comportamento, as palavras positivo e negativo não são usadas para denotar bom ou ruim. Positivo significa simplesmente adição e negativo significa subtração. Além disso, em termos de comportamento, a palavra punição tem como objetivo denotar um comportamento que diminui em frequência, enquanto reforço denota um comportamento que aumenta em frequência.
Quais são os quatro quadrantes do treinamento para cães?
São quatro resultados, ou melhores conseqüências, que ocorrem quando seu cão interage com você e o mundo ao seu redor. Um cão reage de acordo com esses quadrantes, dependendo exatamente do que está acontecendo.
Os cães aprendem através do condicionamento operante e clássico. O termo "condicionamento operante" ocorre quando um cão associa um comportamento a uma conseqüência. De acordo com a Lei do Efeito de Thorndike "as respostas que produzem um efeito satisfatório em uma situação específica se tornam mais propensas a ocorrer novamente nessa situação, e as respostas que produzem um efeito desconfortável se tornam menos propensas a ocorrer novamente nessa situação".
Consequências internas e externas em cães
Essas consequências ocorrem interna e externamente - externamente, como quando você provê uma consequência para latir, dizendo para seu cão calar, internamente, como quando seu cachorro sente calor e ele procura uma sombra debaixo de uma árvore. É importante observar que as consequências que você considera agradáveis ou desagradáveis não são necessariamente percebidas da mesma maneira pelo seu cão. Como as consequências são percebidas é altamente subjetivo e pode variar de um cão para outro.
Por exemplo, alguns cães param de latir e se sentem intimidados pelos proprietários que os repreendem; enquanto outros que anseiam atenção por estarem sozinhos o dia todo, podem desfrutar de uma atenção extra, mesmo que negativa, e continuarão latindo. Outro exemplo? o calor do sol pode parecer terrível do ponto de vista de São Bernardo, enquanto o calor do sol pode ser maravilhoso para um chihuahua.
Reforço e Punição Positiva e Negativa
Pronto para aprender mais sobre os quatro quadrantes do treinamento de cães? O número de sites - alguns até escritos pelos chamados "profissionais" - que continuam promulgando confusão entre os termos reforço negativo, punição negativa e punição positiva é surpreendente. Vamos dar uma olhada neles um a um, o que deve ajudar a esclarecer. Vou fornecer alguns exemplos para cada quadrante por uma questão de clareza.
Então, aqui estão elas: reforço positivo, reforço negativo, punição positiva e punição negativa.
Reforço positivo explicado por Victoria Stillwell
Reforço positivo
Este é o meu método favorito de treinamento. Adoro porque é gentil e eficaz. E, como menciona Thorndike, "as respostas que produzem um efeito satisfatório em uma situação específica tornam-se mais propensas a ocorrer novamente nessa situação". Como seres oportunistas, os cães de fato tendem a repetir comportamentos que têm um efeito satisfatório.
Você já se perguntou por que os cães imploram à mesa? Porque eles são recompensados com comida. Por que os cães pulam nas pessoas? Porque eles são banhados com atenção. Por que os cães contra-surfam? Porque eles encontram pequenos tesouros.
Qual é a "lei" do reforço positivo?
No reforço positivo, o termo "positivo" significa acrescentar algo com o objetivo de aumentar o comportamento (reforço). Então, se você der um biscoito a um cachorro toda vez que ele se sentar, você o verá sentado com mais frequência, especialmente se ele gosta de biscoitos! Se seu cão se sentir bem dormindo no sofá, ele provavelmente pulará no sofá com mais frequência. Se um cachorro pula em seu dono, e o dono o afasta, mas o cachorro gosta da atenção, porque ele ansiava por tudo isso o dia inteiro, provavelmente saltava mais.
As ferramentas destinadas a fornecer reforço positivo incluem clickers, paus de alvo, máquinas de tratamento de dispensadores, brinquedos de rebocadores e tudo o que seu cão adora. Os métodos destinados a reforçar comportamentos incluem elogiar, acariciar, dar guloseimas, brincar com um brinquedo ou qualquer recompensa que o seu cão perceba como boa. Para mais informações sobre recompensas da vida, leia meu artigo sobre o Princípio Premack.
Um exemplo de reforço negativo vs. positivo
Reforço Negativo
Não sou fã de reforços negativos, simplesmente porque geralmente envolve coisas que os cães consideram ruins. No entanto, também é verdade que, às vezes, você pode usar o reforço negativo de uma maneira minimamente aversiva, como no treinamento BAT.
Quais são as "leis" do reforço negativo?
No reforço negativo, o termo "negativo" significa remover algo com o objetivo de aumentar o comportamento (reforço). Nesse caso, estamos tentando remover algo (negativo) com o objetivo de aumentar o comportamento (reforço). Parece um pouco difícil de entender, mas fará sentido quando você olhar alguns exemplos.
Por exemplo, imagine novamente que seu cachorro está sob o sol. O cão não gosta, porque queima a pele e faz com que se sinta muito quente, já que o sol é visto como ruim, o cão vai querer se afastar para se sentir melhor. Então ele vai embaixo da sombra da árvore para obter alívio. Como estar na sombra da árvore é bom, na próxima vez em que ele estiver com um pouco de calor novamente, ele provavelmente continuará sob a árvore quando estiver com calor (reforço).
Se você já trabalhou em treinar seu cão para se sentar, pode ter aplicado um reforço negativo sem saber. Diga que seu cachorro não estava sentado e você decidiu segurá-lo pela coleira para guiá-lo ou empurrar sua garupa. A maioria dos cães não gosta da pressão, então eles são reforçados quando se sentam e você remove esse tipo de pressão (negativa). Em breve, o cão sentará cada vez mais (reforço) apenas para evitar essa pressão. (Não gosto deste método, nem o recomendo). Se você gosta de andar a cavalo, usará reforço negativo. O cavalo sabe que você remove a pressão no reinado quando ele vira ou para. Ele também sabe que você para de pressionar o lado dele com suas botas quando ele começa a acelerar.
Os treinadores de colarinho de choque usam muito o reforço negativo. Eles gostam de dar choque contínuo até que o cão faça o comportamento desejado. Por exemplo, ao treinar um recall, eles ligarão para o cão e darão choque e o soltarão até que o cão venha correndo para eles. Esses métodos brutais de treinamento causam estresse desnecessário em cães e muitos treinadores nem levam tempo para treiná-lo, o que fazer para escapar do choque.
Por que a punição positiva não deve ser usada
Punição positiva
Eu realmente não sou fã de punições positivas, simplesmente porque envolve novamente coisas que muitas vezes são percebidas como ruins pelos cães. Nesse caso, estamos tentando adicionar algo (positivo) a um esforço para interromper um comportamento indesejado (punição). Lembre-se da Lei do Efeito de Thorndike "as respostas que produzem um efeito desconfortável tornam-se menos propensas a ocorrer novamente nessa situação". Vejamos alguns exemplos.
Por exemplo, imagine que seu cachorro vê um gambá e ele o incomoda. Ele então é pulverizado, algo que ele considera ruim e, como conseqüência, ele nunca mais incomoda um gambá (punição). É claro que existem muitos cães que continuarão incomodando gambás, não importa o que aconteça, o que simplesmente confirma que nem todos os cães percebem as coisas da mesma maneira; de fato, para alguns cães, a adrenalina da perseguição supera o risco de ser pulverizada.
Precisa de outro exemplo? Seu filhote faz xixi no tapete e usa um jornal enrolado para puni-lo. A adição do jornal (positivo) faz seu filhote reduzir o comportamento de fazer xixi no tapete (punição)
A "lei" da punição positiva significa que você está simplesmente adicionando algo para diminuir o comportamento.
Os produtos destinados a fornecer punição positiva remotamente ou pelo proprietário do cão incluem tapetes, coleiras, cercas eletrônicas, coleiras de choque, coleira de estrangulamento, colares de pinos, jornais enrolados e quaisquer outras ferramentas que possam ser percebidas negativamente por um cachorro. Lembre-se de que o uso indevido, mesmo um colar de fivela e uma trela, podem ser usados como punição positiva. Métodos baseados em punições positivas incluem garras de colarinho, rolagens alfa e outros métodos baseados em aversão, destinados a intimidar cães.
Um exemplo de punição negativa
Punição negativa
Apesar da palavra "negativa", eu gosto de usar punição negativa, pois os cães parecem responder a ela e é uma maneira eficaz de interromper um comportamento indesejado, sem recorrer a estímulos que o cão considera ruins. Nesse caso, estamos removendo alguma coisa. Vamos dar uma olhada em alguns exemplos.
Seu cachorro pula em você, porque ele fica feliz em vê-lo voltar para casa. Como seu cão está fazendo isso por atenção, a melhor coisa a fazer é se virar e se tornar entediante. Ao se virar, você remove algo que o cão considera bom (a atenção), com o objetivo de eliminar um comportamento. (punição)
Precisa de outro exemplo? Você está treinando seu cão para realizar um comportamento, mas ele não consegue. Nesse caso, remova o tratamento que você estava prestes a dar a ele e dê ao seu outro cão ou coma você mesmo. Nesse caso, você remove algo que seu cão gosta com o objetivo de extinguir um comportamento.
A "lei" da punição negativa significa que você está removendo algo para diminuir o comportamento.
Os métodos destinados a usar punições negativas incluem intervalos de tempo, remoção de atenção, remoção de guloseimas, retenção do clique do clicker. Isso geralmente é acompanhado por um marcador negativo.