Cientistas descobriram que o cérebro utiliza um mecanismo duplo para aprender por tentativa e erro, o que explica como os hábitos são formados e pode ajudar a estabelecer bases para estratégias de tratamento de condições como vícios ou compulsões.

A investigação, conduzida por neurocientistas do Sainsbury Wellcome Centre (SWC) da University College London (UCL) e realizada em ratinhos, poderá também auxiliar no desenvolvimento de terapias para a doença de Parkinson.

O método de aprendizagem por tentativa e erro envolve tentar diferentes opções até encontrar uma que funcione e aprender com os seus erros ao longo do caminho, noticiou na quarta-feira a agência Efe.

"Encontrámos um mecanismo que acreditamos ser responsável pelos hábitos. Uma vez desenvolvida a preferência por uma determinada ação, pode ignorar o sistema baseado em valores e simplesmente confiar na política padrão do que fez no passado", o que também liberta o cérebro para outras tarefas, referiu Marcus Stephenson-Jones, líder do grupo no SWC e autor principal.

Os investigadores descobriram um sinal de dopamina (um neurotransmissor) no cérebro que atua como um tipo diferente de sinal de aprendizagem do que o conhecido anteriormente.

Sabia-se que os sinais de dopamina no cérebro formam erros de previsão de recompensa (EPR) que informam o indivíduo se uma opção é melhor ou pior do que o esperado (é o circuito que leva os indivíduos a procurar o prazer).

Neste novo estudo, os autores descobriram que, paralelamente aos erros de previsão de recompensa, existe um sinal dopaminérgico adicional, denominado erro de previsão de ação (APE), que atualiza a frequência com que uma ação é realizada.

Estes dois sinais de ensino fornecem aos indivíduos (neste caso, os ratos) duas formas distintas de aprender a fazer uma escolha: aprendendo a escolher a opção mais valiosa ou a mais comum, concluiu o estudo.

"Imagine-se a ir à sua cafetaria local. Na primeira vez, pode demorar a escolher uma sanduíche e, dependendo de qual escolher, pode gostar ou não. Mas, se voltar à cafetaria muitas vezes, não perderá mais tempo a pensar em que snack escolher e, em vez disso, começará a escolher um de que gosta por defeito. Acreditamos que é o sinal dopaminérgico do APE que permite armazenar esta política padrão", explicou Stephenson-Jones.

Além disso, este sistema de aprendizagem recentemente descoberto fornece uma forma muito mais simples de armazenar informação do que ter de comparar diretamente o valor de diferentes opções, libertando o cérebro para realizar multitarefas.

Por exemplo, depois de aprender a conduzir, também pode manter uma conversa com alguém durante a viagem. Enquanto o seu sistema padrão executa todas as tarefas repetitivas para conduzir o carro, o seu sistema baseado em valores pode decidir sobre o que falar, explica o estudo.

Os resultados do estudo mostram porque é tão difícil abandonar os maus hábitos e porque é que substituir uma ação por outra pode ser a melhor estratégia: se substituir uma ação de forma consistente, como mascar pastilha elástica de nicotina em vez de fumar, o sistema APE pode assumir o controlo e formar um novo hábito em cima do outro.

Esta investigação tem também potenciais implicações para a doença de Parkinson, que é conhecida por ser causada pela morte de neurónios dopaminérgicos do mesencéfalo, aqueles envolvidos no movimento, que podem ser responsáveis pela codificação do APE, o que poderá explicar porque é que estes doentes têm dificuldade em executar tarefas rotineiras como caminhar, mas podem realizar comportamentos mais flexíveis, como patinar no gelo.

Leia Também: Médico revela truque com as mãos que pode indicar tumor no cérebro