Fala pode ajudar a diferenciar transtornos psicóticos; bastam cinco minutos, mostram estudos iniciais

Fala pode ajudar a diferenciar transtornos psicóticos
O sistema foi capaz de distinguir entre esquizofrenia e transtornos do espectro psicótico, transtorno bipolar, depressão maior, vulnerabilidade subclínica à psicose e o grupo saudável. Pesquisadores firmaram parcerias com clínicas psiquiátricas nos Estados Unidos para avaliar sua viabilidade - Imagem ilustrativa Banco de fotos Vecteezy

Pesquisadores desenvolvem método baseado em inteligência artificial que analisa padrões de linguagem e entonação para apoiar diagnósticos psiquiátricos complexos, depressão e bipolaridade


Um novo estudo publicado na revista Translational Psychiatry indica que apenas cinco minutos de fala gravada podem ser suficientes para ajudar a distinguir entre diferentes transtornos psiquiátricos, incluindo esquizofrenia, psicose, transtorno bipolar e depressão maior. 

Conduzida por Julianna Olah, da Psyrin, e Sunny Xiaojing Tang, da Escola de Medicina Zucker, da Universidade Hofstra, em Hempstead, Nova York, a pesquisa inovadora propõe usar a voz como um biomarcador digital para apoiar diagnósticos psiquiátricos que muitas vezes exigem vários anos de acompanhamento clínico. O financiamento ficou a cargo de Innovate UK, NIH, e Brain and Behavior Research Foundation.

Segundo o artigo, os transtornos psicóticos têm evolução muito mais favorável quando tratados logo após o primeiro episódio. No entanto, identificar quem realmente desenvolverá psicose ainda é um enorme desafio, mesmo entre pessoas com histórico familiar ou fatores genéticos de risco.

Os autores apostaram na possibilidade de identificar padrões sutis da fala que pudessem antecipar diagnósticos ou diferenciar condições que, na prática clínica, com muita frequência são confundidas e podem atrasar o início do tratamento adequado.

Como o estudo foi feito

Foram recrutados 1.140 participantes, divididos em cinco grupos. Pessoas com esquizofrenia ou transtornos do espectro da psicose (84), pacientes com transtorno bipolar (227), indivíduos com sintomas psicóticos subclínicos (343), pacientes com depressão maior (156) e controles saudáveis (330).

Os voluntários realizaram tarefas que consistiam em gravar sua fala em uma plataforma online, incluindo relatar um sonho, descrever imagens, ler textos neutros e narrar pequenas histórias emocionais.

Para a tarefa dediferenciar as doenças, a equipe usou técnicas de processamento de linguagem natural (NLP) e aprendizado de máquina. Foram analisadas 943 horas de gravações. Dessa análise, foram extraídas informações sobre semântica, sintaxe, ritmo, entonação e controle motor da fala.

  • Características linguísticas –  116 parâmetros relacionados à semântica, sintaxe,  ritmo, entonação e controle motor da fala — úteis para captar desorganização do pensamento, típica da psicose.
  • Características paralinguísticas (entonação, ritmo, variação de pitch, pausas, controle motor da fala) — ligadas a afeto achatado e alterações motoras cerebrais.

O que a IA descobriu

Os modelos de aprendizado de máquina alcançaram 86% de precisão ao distinguir entre pessoas saudáveis e aquelas com esquizofrenia ou transtorno bipolar.  Mesma taxa se aplicou à diferenciação entre grupos mais complexos, como indivíduos com experiências psicóticas subclínicas e pacientes com depressão maior. A margem de erro gira em torno de 14%.

A IA foi capaz de distinguir entre esquizofrenia e transtornos do espectro psicótico; transtorno bipolar (com e sem psicose); depressão maior; vulnerabilidade subclínica à psicose grupo saudável. 

Curiosamente, os melhores resultados vieram de tarefas em que os participantes falavam de forma espontânea — como descrever a comida favorita — em vez de apenas ler textos prontos.

Segundo as autoras, alterações de afeto e de controle motor são facilmente detectáveis por meio de características acústicas, enquanto o pensamento desorganizado típico da psicose se reflete mais fortemente nos padrões linguísticos.

Possíveis aplicações

Se confirmada em novos testes, a tecnologia pode se tornar uma ferramenta complementar ao diagnóstico clínico, especialmente em contextos de atenção primária, onde distinguir entre depressão, bipolaridade e transtornos psicóticos é uma tarefa delicada.

“Nosso estudo mostra que é possível realizar uma triagem de transtornos mentais por meio de uma avaliação de fala totalmente automatizada e remota”, afirmam os pesquisadores.

Próximos passos envolvem mais estudos

Apesar dos resultados promissores, os cientistas alertam que ainda é cedo para aplicar o método em larga escala. 

Para que a técnica possa ser aplicada nos consultórios, os próximos passos exigem estudos adicionais que permitam avaliar sua viabilidade no mundo real. Ou seja, como será sua aceitação por parte dos pacientes e dos profissionais de saúde, além, é claro, de sua confiabilidade em diferentes contextos culturais e linguísticos.

Para tanto falta, antes de tudo, a criação de protocolos padronizados de coleta e tamanho de amostras, além da classificação de múltiplas doenças. Abaixo você pode conhecer melhor esses pontos:

Quatro pontos frágeis do artigo

  1. Ambiente de coleta – as gravações foram feitas online, fora de ambiente clínico controlado, o que pode gerar ruído nos dados;
  2. Generalização limitada – os resultados ainda não garantem que o método funcione em populações diferentes (outras culturas, idiomas ou contextos clínicos);
  3. Tarefas de fala – nem todos os exercícios usados tiveram o mesmo valor diagnóstico; isso pode limitar a padronização;
  4. Aplicação clínica prematura – antes de uso real, é preciso validar a aceitabilidade pelos pacientes e profissionais, além de replicar em ensaios clínicos.

O grupo já trabalha em parcerias com clínicas psiquiátricas nos Estados Unidos para validar o sistema. Se avançar, a voz pode se tornar um aliado crucial no diagnóstico precoce e no tratamento de transtornos mentais graves.

[Leia o artigo original]

Detecting schizophrenia, bipolar disorder, psychosis vulnerability and major depressive disorder from 5 minutes of online-collected speech
Olah J., Wong W.L.E., Chaudhry A.R.R., Mena O., Tang S.X. Translational Psychiatry. 2025; 15:241. Publicado em 12 de julho de 2025. https://www.nature.com/articles/s41398-025-03433-0

[Fala comigo, leitor!]

Deixe seu comentário:
📧 inctneurotecr@gmail.com
📱 Instagram: @inctneurotecr
💼 LinkedIn: INCT NeuroTec-R
🌐 Explore mais: https://neurotecr.ctmm.digital


Texto: Marcus Vinicius dos Santos – jornalista CTMM Medicina UFMG