quinta-feira, 24 de dezembro de 2009

# COMO OS CÃES APRENDEM ##

Na psicologia comportamentalista, o ser é estudado em função de sua relação adaptativa com o meio. Esta relação é descrita tendo como base um modelo temporal de três segmentos: antecedente, comportamento e conseqüente. No primeiro segmento, descrevem-se a ocasião na qual o organismo se encontra e os estímulos ao qual está sujeito. Segundo Catânia (1999 p.28-29), estímulo consiste em qualquer aspecto do ambiente (força física ou relações) que afete um organismo, geralmente propiciando uma resposta, que é o termo utilizado para definir um comportamento específico deste mesmo organismo, e que compreende o segundo segmento. Por fim, o terceiro segmento diz respeito às mudanças que a resposta do organismo produziu no ambiente e que por sua vez modificam este próprio organismo em seu modo de interagir com o mundo. As conseqüências podem ser de quatro ordens: reforçadoras positivas, reforçadoras negativas, punitivas positivas e punitivas negativas. As dimensões reforçadoras e punitivas dizem respeito à mudança que produzem na freqüência do comportamento do organismo diante dos mesmos estímulos na ocasião antecedente, em outras palavras, as conseqüências reforçadoras aumentam a probabilidade de um dado comportamento ocorrer diante do mesmo estímulo e as punitivas reduzem esta probabilidade. Já as dimensões positivas ou negativas, descrevem a apresentação e a remoção do estímulo que reforça ou pune, ou seja, é positivo quando como conseqüência de um comportamento um novo estímulo afeta o organismo e é negativa quando como conseqüência há a remoção de um estímulo ou, a não apresentação de um estímulo que tipicamente é conseqüente de dada resposta. A aprendizagem, definida como aquisição e mudança de comportamento, ocorre principalmente em função do reforçamento (seja positivo ou negativo). No reforçamento positivo, apresenta-se como conseqüência de dada resposta um estímulo apetitivo, ou seja, que o organismo tende a buscar. Já no reforçamento negativo, remove-se como conseqüência de dada resposta, um estímulo aversivo (que o organismo tende a evitar) que se apresentava constante desde o segmento antecedente. Ambas as conseqüências aumentam a futura probabilidade de resposta do organismo, contudo com características peculiares. O aprendizado baseado em reforçamento positivo tende a ser mais flexível e preservar características como criatividade (produção de diferentes respostas diante do mesmo estímulo) do organismo, mas sua confiabilidade fica em função de outros aspectos como o tempo de privação do organismo. Já o reforçamento negativo tende a produzir uma confiabilidade de respostas mais consistentes, porém menos criativos e muito mais rígidos à futuras modificações. Ao contrário do reforçamento, a punição reduz a freqüência de respostas, sendo frequentemente utilizada para eliminar comportamentos indesejados. Em sua dimensão positiva apresenta-se como conseqüência a uma dada resposta um estímulo aversivo. E em sua dimensão negativa, como conseqüência a uma dada resposta, remove-se um estímulo apetitivo que estava presente desde o segmento Antecedente ou, deixa-se de apresentar um estímulo apetitivo que é a conseqüência comum da resposta. Em ambos os casos o resultado é a redução da freqüência de resposta. Contudo com efeitos secundários distintos. A punição negativa geralmente ocorre lentamente e, se aplicada de modo consistente, produz a extinção (eliminação) de uma dada resposta do repertório de comportamentos do organismo sem maiores conseqüências. A punição positiva geralmente produz efeitos mais rapidamente que a punição negativa. Contudo, pode propiciar o desenvolvimento de comportamentos de esquiva, agressão ou paralisia dependendo da intensidade e natureza do estímulo aversivo bem como de outras contingências concorrentes. Além disto, a punição positiva não atua sobre os reforçadores, que podem estar presentes e concorrendo com a punição, tornando seus efeitos menos confiáveis que o da punição negativa, pois depende de sua relativa intensidade diante do reforçador. Não só a qualidade ou dimensão das conseqüências afetam a freqüência de um dado comportamento. Esta também é afetada pela freqüência em que conseqüências ocorrem. A esta freqüência de conseqüentes denominamos esquemas de reforçamento. Estes esquemas podem ser de razão (ou seja, número de respostas para a obtenção do reforço) ou intervalo (ou seja, o intervalo de tempo exigido para que a resposta seja seguida pelo reforçador), ambos fixos ou variáveis. Sabe-se que respostas cujo esquema de reforçamento é variável e intermitente ou de razão muito elevada, são respostas cuja freqüência é elevada e regular, sendo também arredias à extinção por punição negativa. Apesar de poderosa, a aprendizagem por conseqüentes não é a única forma de aprendizagem prevista pela psicologia comportamental. O organismo reage a estímulos do ambiente, dependendo de características de ordem genética do organismo. Alguns estímulos eliciam respostas, outros não. Aos estímulos que eliciam respostas denominamos estímulos incondicionados e a suas respectivas respostas de respostas incondicionadas. Já aos estímulos que não provocam respostas os denominamos estímulos neutros. O nome incondicionado é derivado do processo de condicionamento que estamos prestes a descrever. Condicionamento, consiste no processo de aprendizagem por associação espaço-temporal entre dois estímulos, um neutro e um incondicionado, no qual o organismo passa a reagir ao estímulo neutro como se este fosse o estímulo incondicionado. Em outras palavras, pareando contiguamente o estímulo neutro com o incondicionado (necessariamente nesta ordem), por repetição e estabilidade deste pareamento, o organismo passa emitir a resposta incondicionada assim que o estímulo neutro se apresenta, antes mesmo do estímulo incondicionado se torne presente. Quando isto acontece, o estímulo neutro passa a ser chamado de estímulo condicionado e a resposta eliciada por este passa a se chamar resposta condicionada. Algumas vezes, o organismo reage a certos estímulos aos quais nunca foi anteriormente exposto. Este fenômeno ocorre provavelmente em função de uma semelhança (física, estrutural ou relacional) do estímulo inédito com um ou mais estímulos aos quais o organismo já foi exposto, sejam estes condicionados ou incondicionados. Chamamos este fenômeno de Generalização, visto que se generaliza uma resposta a outros estímulos. Por vezes, esta generalização se confirma adaptativamente eficaz, ou seja, ao reagir diante deste novo estímulo, o organismo obtém como conseqüência um reforçamento imediato. Contudo, nem sempre a resposta no novo contexto tem como conseqüência um reforçamento. Certamente, nem todo o estímulo do ambiente é crítico para que o organismo possa responder adequadamente e obter o reforçamento. Assim haverá estímulos que determinam de modo mais consistente em que condições o organismo obterá o reforço, se operar, do que outros estímulos que estão apenas casualmente presentes. Aos estímulos críticos, que sinalizam a condição na qual o comportamento é reforçado, damos o nome de estímulo discriminatório(SD) e aos demais de estímulo delta(S-Delta). O processo de aprendizagem dos estímulos críticos, ou seja, reagindo apenas a SD e não a S-Delta, se denomina discriminação. Todos estes elementos estão incluídos dentro de um processo mais global chamado modelagem (shaping). Este processo se caracteriza pela gradativa transformação de um comportamento inicial, que é comumente emitido pelo organismo em dadas circunstâncias, em um comportamento terminal, que é raro ou inexistente no repertório de comportamentos deste mesmo organismo, por meio de reforçamento (geralmente positivo). Em outras palavras, reforçam-se apenas os comportamentos iniciais que são vagamente mais próximos do comportamento final desejado, e gradativamente amplia-se o requerimento de aproximação com o comportamento terminal. Assim, o processo de aprendizagem se dá por aproximações sucessivas. Por vezes, o organismo não emite (ou emite raramente) comportamentos iniciais que sejam minimamente próximos do comportamento terminal desejado. Quando isto acontece, é necessário lançar mão de outras estratégias. Basicamente são duas as estratégias facilitadoras do processo de modelagem: a instigação (luring) e a orientação (modeling). Ambas são manipulações do ambiente que aumentam a tendência do organismo de emitir uma determinada resposta, reduzindo a probabilidade que faça outros comportamentos não relevantes. O que diferencia uma da outra é a forma como este ambiente é manipulado e o controle que este exerce sobre o comportamento. Na instigação, faz-se uso de um estímulo apetitivo qualquer para atrair o organismo a emitir um determinado comportamento. Já na orientação, as alternativas de comportamento são restringidas por limites impostos pelo ambiente e isto pode incluir a manipulação direta do organismo.