IA Generativa analisa dados médicos mais rápido que equipes de pesquisa humanas
Em um teste inicial da inteligência artificial no campo da pesquisa em saúde, cientistas da Universidade da Califórnia em San Francisco (UCSF) e da Universidade Wayne State descobriram que a IA generativa poderia processar vastos conjuntos de dados médicos muito mais rapidamente do que as equipes tradicionais de ciência da computação — e, em alguns casos, gerar resultados ainda mais robustos. Especialistas humanos gastaram meses analisando as mesmas informações.
Para comparar o desempenho diretamente, os pesquisadores atribuíram tarefas idênticas a grupos diferentes. Algumas equipes contaram exclusivamente com a experiência humana, enquanto outras utilizaram cientistas em colaboração com ferramentas de IA. O desafio era prever o nascimento prematuro utilizando dados de mais de 1.000 mulheres grávidas.
Até mesmo uma dupla de pesquisadores júnior, composta pelo estudante de mestrado da UCSF, Reuben Sarwal, e pelo estudante do ensino médio, Victor Tarca, conseguiu desenvolver modelos preditivos com o apoio da IA. O sistema gerou códigos funcionais em minutos — algo que normalmente levaria programadores experientes várias horas ou até dias.
A vantagem decorreu da capacidade da IA de escrever códigos analíticos baseados em prompts curtos, mas altamente específicos. Nem todos os sistemas tiveram um bom desempenho. Apenas 4 dos 8 chatbots de IA produziram códigos utilizáveis. No entanto, os que tiveram sucesso não exigiram grandes equipes de especialistas para orientá-los.
Devido a essa rapidez, os pesquisadores juniores puderam concluir seus experimentos, verificar suas descobertas e submeter seus resultados a uma revista em apenas alguns meses.
“Essas ferramentas de IA podem aliviar um dos maiores gargalos da ciência de dados: a construção de nossos fluxos de análise,” afirmou Marina Sirota, PhD, professora de Pediatria que é a diretora interina do Bakar Computational Health Sciences Institute (BCHSI) da UCSF e a principal investigadora do Centro de Pesquisa sobre Nascimento Prematuro da March of Dimes na UCSF. “O aceleramento não poderia chegar em melhor hora para os pacientes que precisam de ajuda agora.”
Sirota é co-autora sênior do estudo, publicado na Cell Reports Medicine em 17 de fevereiro.
Importância da Pesquisa sobre Nascimento Prematuro
A aceleração da análise de dados poderia melhorar ferramentas diagnósticas para o nascimento prematuro — a principal causa de morte neonatal e um importante fator contribuinte para desafios motores e cognitivos a longo prazo em crianças. Nos Estados Unidos, cerca de 1.000 bebês nascem prematuramente a cada dia.
Os pesquisadores ainda não compreendem completamente as causas do nascimento prematuro. Para investigar os possíveis fatores de risco, a equipe de Sirota compilou dados do microbioma de aproximadamente 1.200 mulheres grávidas cujos resultados foram acompanhados em nove estudos diferentes.
“Esse tipo de trabalho só é possível com o compartilhamento aberto de dados, reunindo as experiências de muitas mulheres e a expertise de vários pesquisadores,” disse Tomiko T. Oskotsky, MD, co-diretor do Repositório de Dados sobre Nascimento Prematuro da March of Dimes, professor associado no UCSF BCHSI e coautor do artigo.
No entanto, a análise de um conjunto de dados tão vasto e complexo provou ser desafiadora. Para enfrentar esse desafio, os pesquisadores recorreram a uma competição global de crowdsourcing chamada DREAM (Diálogo sobre Avaliação e Métodos de Engenharia Reversa).
Sirota co-liderou um dos três desafios de gravidez da DREAM, focando especificamente em dados do microbioma vaginal. Mais de 100 equipes de todo o mundo participaram, desenvolvendo modelos de aprendizado de máquina projetados para detectar padrões associados ao nascimento prématuro. A maioria dos grupos concluiu seu trabalho dentro do prazo de três meses da competição. No entanto, levou quase dois anos para consolidar os resultados e publicá-los.
Testando IA em Dados de Gravidez e Microbioma
Curiosa para saber se a IA generativa poderia encurtar esse cronograma, a equipe de Sirota se uniu a pesquisadores liderados por Adi L. Tarca, PhD, coautor sênior e professor no Centro de Medicina Molecular e Genética da Universidade Wayne State em Detroit, MI. Tarca havia liderado os outros dois desafios DREAM, que se concentraram em melhorar métodos para estimar a fase da gravidez.
Juntos, os pesquisadores instruíram oito sistemas de IA a gerar algoritmos de forma independente usando os mesmos conjuntos de dados dos três desafios DREAM, sem codificação humana direta.
Os chatbots de IA receberam instruções cuidadosas em linguagem natural. Assim como o ChatGPT, os sistemas foram guiados por prompts detalhados destinados a direcioná-los a analisar os dados de saúde de maneiras comparáveis às dos participantes originais da DREAM.
Seus objetivos refletiram os desafios anteriores. Os sistemas de IA analisaram dados do microbioma vaginal para identificar sinais de nascimento prematuro e examinaram amostras de sangue ou de placenta para estimar a idade gestacional. A datação da gravidez é quase sempre uma estimativa, mas determina o tipo de atendimento que as mulheres recebem à medida que as gestações progridem. Quando as estimativas são imprecisas, a preparação para o parto se torna mais difícil.
Os pesquisadores então executaram o código gerado pela IA usando os conjuntos de dados da DREAM. Apenas 4 das 8 ferramentas produziram modelos que corresponderam ao desempenho das equipes humanas, embora em alguns casos os modelos de IA tenham se saído melhor. Todo o esforço de IA generativa — desde a concepção até a submissão de um artigo — levou apenas seis meses.
Os cientistas enfatizam que a IA ainda exige supervisão cuidadosa. Esses sistemas podem produzir resultados enganosos, e a expertise humana continua sendo essencial. No entanto, ao classificar rapidamente grandes conjuntos de dados de saúde, a IA generativa pode permitir que os pesquisadores gastem menos tempo resolvendo problemas de código e mais tempo interpretando resultados e formulando perguntas científicas significativas.
“Graças à IA generativa, pesquisadores com uma formação limitada em ciência de dados não precisarão sempre formar grandes colaborações ou passar horas depurando código,” afirmou Tarca. “Eles podem focar em responder às perguntas biomédicas certas.”
Autores: Os autores da UCSF são Reuben Sarwal; Claire Dubin; Sanchita Bhattacharya, MS; e Atul Butte, MD, PhD. Outros autores incluem Victor Tarca (Huron High School, Ann Arbor, MI); Nikolas Kalavros e Gustavo Stolovitzky, PhD (Universidade de Nova York); Gaurav Bhatti (Universidade Wayne State); e Roberto Romero, MD, D(Med)Sc (Instituto Nacional de Saúde Infantil e Desenvolvimento Humano (NICHD)).
Financiamento: Este trabalho foi financiado pelo Centro de Pesquisa sobre Nascimento Prematuro da March of Dimes na UCSF, e pela ImmPort. Os dados utilizados neste estudo foram gerados em parte com o apoio da Pregnancy Research Branch do NICHD.
