N達o O mate!
a nova arte de ensinar e treinar
Karen Pryor
“Este livro delicioso, de fácil compreensão e extremamente útil, é indicado para todos os que queiram compreender ou modificar o comportamento de um animal – seja um cão que ladre, um vizinho bisbilhoteiro, um gato hostil ou o próprio leitor e os seus maus hábitos.” Dr.ª Carol Tavris, autora de Anger
Não O mate!
a nova arte de ensinar e treinar Edição Revista
Karen Pryor Tradução: Alexandra Costa de Souza
ed
Este livro é a tradução da obra com o título original: Don’t Shoot the Dog. © Karen Pryor, 1984, 1999 © 1999 Publicado por: Sunshine Books, Inc. Waltham, EUA Este livro é publicado com a autorização de Karen Pryor © Karen Pryor, 1999 (versão inglesa) © Kns ediciones SC, 2013 (versão portuguesa) Primeira edição: 2013 Tradução: Alexandra Costa de Souza Desenho capa: Alberto Mosquera Lorenzo Composição gráfica: Ana Loureiro Correção de estilo: Amália Coelho Fotografia da capa: Alberto Mosquera Lorenzo ISBN 978-84-940650-8-8 Depósito Legal C 1233-2013 Impressão: TÓRCULO. Impresso em Espanha.
Para obter este livro ou outros desta editora, contacte: www.knsediciones.com comercial@knsediciones.com Todos os direitos reservados. Esta publicação não poderá ser reproduzida nem transmitida por qualquer meio ou procedimento, eletrónico ou mecânico, incluindo fotocópias, gravações e sistema de armazenamento e recuperação de dados, sem prévia autorização escrita do editor.
À minha mãe, Sally Ondeck à minha madrasta, Ricky Wylie e Winifred Sturley, professora e amiga
Índice Prefácio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1 Reforço: Melhor do que prémios .. . . . . . . . . . . . . . . 21 Vamos conhecer a ferocidade dos advogados de Wall Street; como comprar presentes e fazer elogios – ou não; um gorila resmungão, um panda hostil e uma adolescente cruel (a autora); vamos aprender a jogar a dinheiro, a morder o lápis, a apaixonarmo-nos por calcanhares e outros maus hábitos; vamos saber como reeducar um professor autoritário ou um patrão rabugento sem que eles saibam que o fizemos; e mais umas tantas coisas.
2 Moldagem (Shaping): Desenvolver um super desempenho sem pressão ou dor .. . . . 59 Como conduzir uma ópera; como bater uma bola; como lidar com um mau boletim de avaliação. Jogos de salão para treinadores. Notas sobre baleias assassinas, Nim Chimpsky, Zen, Gregory Bateson, a Escola de Brearley, porque ficam os gatos presos nas árvores e como treinar uma galinha.
3 Controlo do Estímulo: Cooperação sem Coação .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 Ordens, comandos, pedidos, sinais, deixas e meias palavras; o que funciona e o que não funciona. O que a disciplina não é. Quem é obedecido e porquê. Como parar de gritar com os seus filhos. Dança, grupos de exercício físico, música, artes marciais e outros usos recreativos do controlo de estímulos.
4 Destreinar: Usar o reforço para se livrar de comportamentos indesejados .. . . . . . . . . . . . . . 133 Oito métodos para se livrar de comportamentos indesejados, de companheiros de quarto desarrumados a cães que ladram, mau ténis e vícios perigosos, começando com o Método 1: Mate o Animal, que definitivamente funciona, e terminando com o Método 8: Altere a Motivação, um método mais humano e igualmente eficaz.
5 O Reforço no Mundo Real .. . . . . . . . . . . . . . . . . . . . . . . . . 185 O que tudo isto significa. Ler mentes, treinar equipas olímpicas, como pode a felicidade afetar lucros empresariais, formas de lidar com outros governos e outras aplicações práticas da teoria do reforço.
6 Treino com Clicker: Uma nova tecnologia . 205 Dos tanques de golfinhos ao quintal de cada um: donos de cães de todo o mundo abandonam a coleira estranguladora a favor do clicker. Benefícios a longo prazo: aceleração da aprendizagem, precisão, confiança, melhor comunicação e diversão. The Great Internet Canine Hot Dog Challenge; alguns cavalos bastante atraentes; um programa piloto; clicking e autismo. Mudar o mundo com um clique de cada vez.
Outros Recursos .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227 Agradecimentos .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231 Sobre a autora . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
Prefácio
Este livro debruça-se sobre o modo de treinar qualquer um – humano ou animal, novo ou velho, a si próprio ou outros – a fazer qualquer coisa que possa e deva ser feita. Como tirar o gato da mesa da cozinha ou fazer com que a sua avó deixe de o aborrecer. Como influenciar o comportamento dos seus animais de estimação, dos seus filhos, do seu patrão, dos seus amigos. Como melhorar o seu lançamento no ténis, o seu jogo de golfe, a sua destreza matemática, ou a sua memória. Tudo isto através dos princípios do treino de reforço. Estes princípios são leis, tal como as leis da física. Estão subjacentes a todas as situações de aprendizagem e ensino, assim como as leis da gravidade estão subjacentes à queda de uma maçã. Sempre que tentamos alterar o comportamento, seja o nosso ou o dos outros, utilizamos estas leis, ainda que o não saibamos. Normalmente, usamo-las inapropriadamente. Ameaçamos, discutimos, coagimos, limitamos. Atacamos os outros quando as coisas correm mal e deixamos passar a oportunidade de os louvar quando correm bem. Somos severos e impacientes com os nossos filhos, uns com os outros, mesmo connosco; e sentimo-nos culpados por essa severidade. Sabemos que com métodos melhores alcançaríamos resultados mais rapidamente e sem causar ansiedade, no entanto, não conseguimos conceber tais métodos. Simplesmente não estamos em sintonia com os meios através dos quais os treinadores modernos beneficiam das leis do reforço positivo. Seja qual for o treino, manter uma criança de quatro anos quieta em público, domesticar um cachorro, treinar uma equipa, ou memorizar um poema, será mais rápido, melhor, e até mais divertido, se souber como usar o reforço positivo. – 11 –
Não o mate! A nova arte de ensinar e treinar
As leis de reforço são simples; pode escrevê-las num quadro em dez minutos e aprendê-las numa hora. Aplicar estas leis é um desafio; o treino de reforço é como um jogo, baseado no raciocínio rápido. Qualquer pessoa pode ser treinador; algumas revelam o jeito logo desde o início. Não é preciso ter qualidades especiais de paciência ou uma personalidade forte, nem jeito para lidar com animais e crianças, ou aquilo a que o treinador de circo Frank Buck chamava o poder do olho humano. Só tem de saber o que está a fazer. Há sempre pessoas com uma compreensão intuitiva de como aplicar as leis do treino. Conhecemo-los como professores talentosos, oficiais brilhantes, treinadores vitoriosos e treinadores de animais geniais. Já me deparei com vários encenadores e maestros extraordinariamente habilidosos no uso do reforço. Estes treinadores dotados não precisam de livros para tirarem partido das leis que influenciam o treino. No entanto, para o resto das pessoas que tentem lidar com um animal de estimação descontrolado, ou que estejam em conflito com uma criança ou com um colega de trabalho, saber como funciona realmente o reforço pode ser uma bênção. O treino de reforço não é um sistema de prémio e castigo – geralmente, os treinadores modernos nem sequer usam estes termos. O conceito de prémio e castigo engloba uma carga de associações emocionais e interpretações, tais como o desejo, o terror, a culpa, coisas que devemos ou não devemos fazer. Por exemplo, oferecemos prémios a outros por coisas que nós fizemos – como, por exemplo, dar um gelado a uma criança como prémio após uma reprimenda. Temos igualmente tendência para achar que sabemos o que deve servir de prémio: um gelado, por exemplo, ou um elogio. Mas algumas pessoas não gostam de gelados e elogios vindos da pessoa errada ou pela razão errada podem até magoar. Em alguns casos, o elogio de um professor pode garantir o ridículo por parte dos colegas. – 12 –
Prefácio
Esperamos que as pessoas façam o que está certo sem necessidade de prémios. A nossa filha adolescente deve lavar a louça porque esse é o seu dever para connosco. Zangamo-nos com as crianças ou com empregados se eles partirem alguma coisa, se roubarem, se chegarem tarde ou falarem com maus modos, etc., porque já deviam saber que é errado. Castigamos, muitas vezes bastante tempo após o comportamento ocorrido – mandar pessoas para a prisão é um bom exemplo – criando assim um evento que pode não ter qualquer efeito no comportamento futuro, e que é, no fundo, uma mera retribuição. No entanto, vemos este tipo de castigo como educativo, e as pessoas facilmente o referem como: “Dei-lhe uma lição”. O treino de reforço moderno baseia-se não na crença popular, mas na ciência do comportamento. Cientificamente falando, o reforço é um evento que (a) ocorre durante ou após um comportamento; e (b) aumenta a probabilidade desse comportamento acontecer no futuro. Neste caso, os elementos-chave são dois: os dois acontecimentos estão relacionados em tempo real – o comportamento gera o reforço – e depois o comportamento torna-se mais frequente. Os reforços podem ser positivos, algo de que o formando goste e do qual deseje mais, como um sorriso ou uma festa, ou, podem ser negativos, algo a evitar, como um puxão na trela ou um sobrolho carregado. O que se torna decisivo é o facto de haver uma relação temporal entre eles – o comportamento ocorre, seguindo-se o reforço e, subsequentemente, o comportamento que originou um bom resultado ou que preveniu um mau resultado, é mais frequente. De facto, a definição funciona nos dois sentidos, como um ciclo de retorno: Se o comportamento não aumentar, ou o reforço surgir demasiado cedo ou demasiado tarde, ou ainda se o prémio escolhido não tiver o efeito de reforço nesse indivíduo. Para além disso, julgo haver uma diferença fundamental entre a teoria de reforço, a ciência, e o treino de reforço, a aplicação – 13 –
Não o mate! A nova arte de ensinar e treinar
específica dessa ciência. Os estudos revelam que um comportamento seguido de uma consequência agradável aumenta a probabilidade desse comportamento. Isso é verdade; mas, na prática, para atingir os resultados sensacionais a que nós treinadores nos habituámos, o reforço deve ocorrer no preciso instante em que se dá o comportamento. Bingo! Agora! Naquele instante, em tempo real, o formando tem de saber que o que está a fazer agora lhe valeu um prémio. Os treinadores modernos têm desenvolvido ótimos atalhos para o reforço instantâneo: primeiro, o uso de um sinal que identifique o comportamento. Esta versão revista de Não o mate! (Don’t Shoot the Dog!) trata das leis do reforço, algumas aplicações práticas dessas leis no mundo real, e do movimento de base conhecido, até agora, como treino com clicker (marcador), que tem levado a tecnologia até áreas novas e inexploradas. A primeira vez que entrei em contacto com o treino de reforço positivo estava no Havai, em 1963, onde me candidatei como treinadora chefe de golfinhos num oceanário, no Sea Life Park. Já tinha treinado cães e cavalos através de métodos tradicionais, mas os golfinhos eram uma proposta diferente; não se pode usar uma trela ou um freio, ou mesmo o punho num animal que nada. Reforços positivos – principalmente baldes de peixe – eram as únicas ferramentas disponíveis. Um psicólogo delineou-me os princípios do treino com reforço. Aprendi com os golfinhos a arte de aplicar esses princípios. Formada em biologia e permanentemente interessada em comportamento animal, fiquei fascinada, não tanto com os golfinhos, mas com a comunicação que poderia existir entre nós – de mim para o animal e do animal para mim – durante este tipo de treino. Apliquei o que aprendi com o treino dos golfinhos no treino de outros animais. E comecei a aperceber-me de que algumas aplicações do sistema se estavam a introduzir no meu dia-a-dia. Por exemplo, deixei de gritar com os meus filhos, porque comecei a reparar que isso não funcionava. Estar atenta a comportamen– 14 –
Prefácio
tos de que gostava, e reforçá-los quando ocorriam, funcionou muito melhor e também manteve a paz. Existe uma grande quantidade de teoria científica subjacente ao que aprendi com o treino dos golfinhos. Neste livro, ultrapassaremos a teoria, pois, tanto quanto sei, as regras da aplicação destas teorias não são descritas pela ciência e, na minha opinião, são muitas vezes mal aplicadas pelos cientistas. Mas as leis fundamentais são bem estabelecidas e devem ser tomadas em conta durante o treino. O estudo deste corpus teórico é conhecido de diversas formas: moldagem (shaping) do comportamento do comportamento, teoria do reforço, condicionamento operante, behaviorismo, psicologia comportamental e análise do comportamento: o ramo da psicologia geralmente atribuída ao professor de Harvard, B. F. Skinner. Não conheço nenhum corpus de informação científica que tenha sido tão difamado, incompreendido, mal-interpretado, sobre-interpretado e manipulado. O próprio nome de Skinner provoca ira naqueles que defendem o “livre arbítrio” como a característica que separa o Homem do animal. Para os académicos de tradição humanística, a manipulação do comportamento humano por uma espécie de técnica consciente parece incorrigivelmente perversa, apesar do facto óbvio de que andamos todos a tentar manipular o comportamento uns dos outros a toda a hora e de qualquer maneira. Enquanto os humanistas têm atacado o behaviorismo e o próprio Skinner com um fervor geralmente reservado para as heresias religiosas, o behaviorismo tornou-se num enorme ramo da psicologia, com departamentos universitários, clínicos profissionais, imprensa especializada, congressos internacionais, pós-graduações, doutrinas, cismas e uma vasta literatura. E houve até vantagens. Alguns distúrbios – o autismo, por exemplo – parecem reagir à moldagem e ao reforço como a nenhum outro tratamento. Muitos terapeutas individuais têm tido – 15 –
Não o mate! A nova arte de ensinar e treinar
sucesso na resolução dos problemas emocionais dos pacientes através do uso de técnicas comportamentais. A eficácia, pelo menos em algumas circunstâncias, de simplesmente alterar o comportamento em vez de aprofundar as suas origens tem vindo a contribuir para o aumento da terapia familiar, em que o comportamento de cada membro da família é observado e não apenas o comportamento daquele que parece mais perturbado. Isto revela bom senso. As máquinas de ensino e os manuais programados resultantes da teoria de Skinner foram as primeiras tentativas de fazer moldagem da aprendizagem passo a passo e de reforçar o aluno pelas respostas corretas. Estes primeiros mecanismos eram desajeitados, mas conduziram diretamente à IAC (Instrução Assistida por Computador), que é muito engraçada devido à natureza divertida dos reforços (fogo de artifício, robôs que dançam), além de extremamente eficaz devido ao timing perfeito do computador. Os programas de reforço que utilizam símbolos ou fichas que podem ser acumulados e trocados por rebuçados, cigarros ou privilégios, têm sido implementados em hospitais psiquiátricos e outras instituições. Os programas de auto-formação para controlo do peso e outras alterações de hábitos abundam. Sistemas educativos eficazes baseados nos princípios de moldagem (shaping) e reforço, tais como o Ensino de Precisão e a Instrução Direta, estão a entrar nas nossas escolas. E o biofeedback é uma aplicação interessante do reforço no treino de respostas psicológicas. Os académicos têm estudado os aspetos mais minuciosos do condicionamento. Uma descoberta revela, por exemplo, que, se fizer uma tabela para registar o seu progresso num programa de auto-formação, é mais provável que mantenha hábitos novos se preencher totalmente um pequeno quadrado todos os dias nessa tabela do que se simplesmente marcar o quadrado com um visto. Esta obsessão pelo detalhe tem fundamentos psicológicos válidos, mas não é exemplo de um bom treino. O treino é um círculo, uma comunicação em dois sentidos, em que um aconte– 16 –
Prefácio
cimento num determinado ponto do ciclo altera os acontecimentos noutro ponto, tal como um sistema de resposta cibernético; no entanto, muitos psicólogos encaram o seu trabalho como algo que fazem ao sujeito e não com o sujeito. Para um treinador, as respostas idiossincráticas e inesperadas fornecidas por um sujeito são as mais interessantes e, potencialmente, são os acontecimentos mais férteis no processo de treino; no entanto, quase todo o trabalho experimental é concebido para ignorar ou minimizar as respostas individualistas. Elaborar métodos para o que Skinner designou moldagem, a alteração progressiva do comportamento, e executar esses métodos é um processo criativo. Mas a literatura psicológica está tão cheia de programas de shaping (moldagem) sem imaginação, para não dizer desastrados, que acabam por constituir, na minha opinião, um castigo cruel e estranho. Por exemplo, numa publicação recente, em que um tratamento da enurese noturna envolvia não só colocar sensores de “humidade” na cama da criança, como também a presença do terapeuta durante a noite! Os autores tiveram ainda a fineza de, apologeticamente, dizer que ficou bastante caro para a família. E o custo para a psique da criança? Este tipo de solução “comportamental” equivale a tentar matar moscas com uma pá. Schopenhauer disse uma vez que todas as ideias originais são primeiro ridicularizadas, depois vigorosamente atacadas e, finalmente, aceites como garantidas. A meu ver, a teoria do reforço não tem sido exceção. Skinner foi amplamente ridicularizado, há anos, por demonstrar o desenvolvimento do comportamento de um par de pombos jogadores de pingue-pongue. O berço caloroso, confortável, com auto-limpeza e divertimento incorporado que ele construiu para as filhas pequenas, foi ridicularizado como uma “caixa para bebés” desumana, imoral e herética. Ainda correm rumores de que as suas filhas enlouqueceram, quando, na verdade, são ambas profissionais de sucesso e mulheres encantadoras. Finalmente, hoje em dia, muitas pessoas instruídas consideram a teoria do reforço algo sem importância que sempre – 17 –
Não o mate! A nova arte de ensinar e treinar
conheceram e compreenderam. De facto, a maioria das pessoas não a compreende, senão não demonstrariam comportamentos tão errados perante aqueles que as rodeiam. Desde a minha experiência de treino com golfinhos que faço palestras e escrevo sobre as leis do reforço, quer para círculos académicos e profissionais, quer para o público em geral. Ensino este tipo de treino a alunos de escolas secundárias, faculdades e pós-graduações, a donas de casa e a tratadores de jardim zoológico, à família e amigos, e em seminários ao fim de semana, a vários milhares de donos de cães e treinadores. Observo e estudo todos os tipos de treinadores, desde vaqueiros a treinadores de diversas modalidades desportivas, e reparo que os princípios do treino de reforço se vão gradualmente tornando visíveis. Os treinadores de animais em Hollywood chamam ao uso de reforço positivo “treino afetivo” e estão a utilizar estas técnicas para obterem comportamentos impossíveis de obter pela força, como acontece em muitos comportamentos de porcos e outros animais no filme Babe. Hoje, muitos treinadores olímpicos utilizam o reforço positivo e a moldagem, em vez da velha intimidação, e têm obtido melhorias notáveis no desempenho. No entanto, não encontrei escritas em lado nenhum as regras da teoria do reforço a fim de serem aplicadas em situações práticas imediatas. Assim, aqui estão neste livro, explicadas como as compreendo e como as vejo aplicadas, mal ou bem, na vida real. O treino de reforço não resolve todos os problemas – não irá engordar a sua conta bancária, não poderá salvar um mau casamento, e não resolverá distúrbios de personalidade graves. Situações como um bebé chorão, não implicam problemas de treino e exigem outro tipo de solução. Alguns comportamentos, tanto nos animais como nas pessoas, têm componentes genéticos que podem ser difíceis ou impossíveis de modificar com o treino. Há problemas que nem merecem o esforço. Mas, em muitos desafios da vida, tarefas e chatices, o uso correto do reforço pode ser uma ajuda. – 18 –
Prefácio
Usar o reforço positivo numa determinada situação pode mostrar-lhe como usá-lo noutras. Um investigador de golfinhos com quem trabalhei disse amargamente, “Ninguém devia poder ter um filho sem primeiro ser obrigado a treinar uma galinha”, o que significa que a experiência de obter resultados com uma galinha, um organismo que não pode ser treinado pela força, evidencia que não são necessários castigos para obter bons resultados com um bebé. E a experiência devia dar-lhe algumas ideias sobre como reforçar o comportamento do bebé. Reparei que a maioria dos treinadores de golfinhos, utilizadores das técnicas de reforço positivo no seu trabalho quotidiano, tem filhos surpreendentemente simpáticos e bem-educados. Este livro não lhe garante filhos bem-educados. Aliás, não promete competências ou resultados específicos, mas pode fornecer-lhe os princípios fundamentais subjacentes a todo o treino e algumas orientações sobre como aplicar criativamente esses princípios em diversas situações. Permitir-lhe-á aliviar irritações que o perturbam há anos, ou avançar em áreas em que está bloqueado. Irá com certeza, e se quiser, ajudá-lo a treinar uma galinha. Parece haver uma ordem natural no treino de reforço. Estes capítulos surgem acompanhando a sequência de situações de treino simples a complexas, sendo também esta a sequência que parece facilitar a aprendizagem de um verdadeiro treinador. A organização deste livro é progressiva, para que se possa desenvolver um conhecimento globalizante do treino de reforço positivo. No entanto, a sua aplicação deve ser prática. Ao longo dos capítulos do livro surgem situações reais que funcionam como ilustrações. Os métodos específicos devem ser encarados como sugestões ou inspirações, não como instruções definitivas.
– 19 –