IA Detecta Câncer e Revela Sua Identidade
- Um novo estudo revela que sistemas de inteligência artificial utilizados para diagnosticar câncer a partir de lâminas de patologia não apresentam desempenho uniforme para todos os pacientes, com a precisão variando entre diferentes grupos demográficos.
- Os pesquisadores identificaram três razões principais para esse viés e desenvolveram uma nova abordagem que reduziu significativamente essas diferenças.
- Os resultados destacam a importância de avaliar rotineiramente a IA médica quanto a viés para garantir um cuidado justo e confiável no tratamento do câncer para todos.
Patologia e os Fundamentos do Diagnóstico do Câncer
Há décadas, a patologia desempenha um papel fundamental na forma como os médicos diagnosticam e tratam o câncer. Um patologista analisa uma fatia extremamente fina de tecido humano sob um microscópio, buscando sinais visuais que indicam a presença de câncer e, se existirem, qual tipo e estágio foram alcançados.
Para um especialista treinado, a análise de uma amostra de tecido rosa, com padrões roxos, é como corrigir um teste sem a identificação do aluno — a lâmina contém informações vitais sobre a doença, mas não revela a identidade do paciente.
Quando a IA Enxerga Mais do Que o Esperado
Essa suposição não se aplica totalmente aos sistemas de inteligência artificial que estão entrando nos laboratórios de patologia. Um novo estudo liderado por pesquisadores da Harvard Medical School mostra que os modelos de IA em patologia podem inferir detalhes demográficos diretamente a partir das lâminas de tecido. Essa capacidade inesperada pode introduzir viés no diagnóstico do câncer entre diferentes grupos de pacientes.
Após avaliar vários modelos de IA amplamente utilizados para identificar câncer, os pesquisadores descobriram que esses sistemas não apresentavam desempenho igual para todos os pacientes. A precisão diagnóstica variava conforme a raça, gênero e idade relatados pelos pacientes. A equipe também identificou várias razões para a ocorrência dessas disparidades.
Para abordar o problema, os pesquisadores desenvolveram uma estrutura chamada FAIR-Path, que reduziu significativamente o viés nos modelos testados.
“Ler dados demográficos a partir de uma lâmina patológica é considerado uma ‘missão impossível’ para um patologista humano, então o viés na IA de patologia nos surpreendeu”, disse o autor sênior Kun-Hsing Yu, professor associado de informática biomédica no Blavatnik Institute da HMS e professor assistente de patologia no Brigham and Women’s Hospital.
Yu enfatizou que reconhecer e corrigir o viés na IA médica é crucial, pois pode influenciar diretamente a precisão do diagnóstico e os resultados dos pacientes. O sucesso do FAIR-Path sugere que melhorar a equidade na IA em patologia do câncer, e possivelmente em outras ferramentas médicas de IA, pode não exigir mudanças drásticas nos sistemas existentes.
O trabalho, apoiado parcialmente por financiamento federal, foi descrito em 16 de dezembro na Cell Reports Medicine.
Colocando a IA do Câncer à Prova
Yu e sua equipe investigaram o viés em quatro modelos comuns de IA para patologias que estão sendo desenvolvidos para o diagnóstico do câncer. Esses sistemas de aprendizado profundo foram treinados em grandes coleções de lâminas de patologia rotuladas, permitindo-lhes aprender padrões biológicos e aplicar esse conhecimento a novas amostras.
A equipe avaliou os modelos usando um grande conjunto de dados multi-institucional que incluía lâminas de patologia de 20 tipos diferentes de câncer.
Em todos os quatro modelos, lacunas de desempenho emergiram consistentemente. Os sistemas de IA foram menos precisos para certos grupos demográficos definidos por raça, gênero e idade. Por exemplo, os modelos tiveram dificuldades em distinguir subtipos de câncer de pulmão em pacientes afro-americanos e em pacientes do sexo masculino. Eles também apresentaram precisão reduzida ao classificar subtipos de câncer de mama em pacientes mais jovens. Além disso, os modelos tiveram dificuldade em detectar cânceres de mama, renal, tireoide e estômago em alguns grupos demográficos. No total, essas disparidades apareceram em cerca de 29% das tarefas de diagnóstico analisadas.
De acordo com Yu, esses erros surgem porque os sistemas de IA extraem informações demográficas das imagens de tecido — e então se baseiam em padrões vinculados a essas demografias ao tomar decisões diagnósticas.
Os achados foram inesperados. “Porque esperaríamos que a avaliação patológica fosse objetiva”, disse Yu. “Quando avaliamos imagens, não precisamos necessariamente conhecer os dados demográficos de um paciente para fazer um diagnóstico.”
Isso levou os pesquisadores a perguntar uma questão importante: Por que a IA em patologia não estava atendendo ao mesmo padrão de objetividade?
Por Que o Viés Aparece na IA em Patologia
A equipe identificou três principais fatores que contribuem para o viés.
Primeiro, os dados de treinamento costumam ser desiguais. As amostras de tecido são mais fáceis de obter de alguns grupos demográficos em comparação a outros, resultando em conjuntos de dados desequilibrados. Isso torna mais difícil para os modelos de IA diagnosticar cânceres em grupos sub-representados, incluindo algumas populações definidas por raça, idade ou gênero.
No entanto, Yu observou que “o problema acabou se mostrando muito mais profundo do que isso”. Em vários casos, os modelos apresentaram pior desempenho para certos grupos demográficos mesmo quando os tamanhos das amostras eram semelhantes.
Uma análise adicional apontou para diferenças na incidência da doença. Alguns cânceres ocorrem com mais frequência em populações específicas, permitindo que os modelos de IA se tornem especialmente precisos para esses grupos. Como resultado, os mesmos modelos podem ter dificuldades em diagnosticar cânceres em populações onde essas doenças são menos comuns.
Os pesquisadores também descobriram que os modelos de IA podem detectar diferenças moleculares sutis entre grupos demográficos. Por exemplo, os sistemas podem identificar mutações em genes que impulsionam o câncer e usá-las como atalhos para classificar o tipo de câncer — o que pode reduzir a precisão em populações onde essas mutações são menos prevalentes.
“Descobrimos que, devido ao poder da IA, ela pode diferenciar muitos sinais biológicos obscuros que não podem ser detectados pela avaliação humana padrão”, disse Yu.
Com o tempo, isso pode fazer com que os modelos de IA se concentrem em sinais relacionados mais aos dados demográficos do que à própria doença, comprometendo o desempenho diagnóstico em diversos grupos de pacientes.
Em conjunto, Yu disse que essas descobertas mostram que o viés na IA em patologia é influenciado não apenas pela qualidade e pelo equilíbrio dos dados de treinamento, mas também pela forma como os modelos são treinados para interpretar o que veem.
Uma Nova Abordagem para Reduzir o Viés
Após identificar as fontes de viés, os pesquisadores buscaram corrigi-las.
Desenvolveram o FAIR-Path, uma estrutura baseada em um método de aprendizado de máquina existente conhecido como aprendizado contrastivo. Essa abordagem modifica o treinamento da IA para que os modelos se concentrem mais fortemente nas distinções críticas, como diferenças entre tipos de câncer, enquanto reduzem a atenção a diferenças menos relevantes, incluindo características demográficas.
Quando o FAIR-Path foi aplicado aos modelos testados, as disparidades diagnósticas caíram em cerca de 88%.
“Mostramos que, ao fazer esse pequeno ajuste, os modelos podem aprender características robustas que os tornam mais generalizáveis e justos entre diferentes populações”, disse Yu.
O resultado é encorajador, acrescentou, pois sugere que reduções significativas de viés são possíveis mesmo sem conjuntos de dados de treinamento perfeitamente balanceados ou totalmente representativos.
Olhando para o futuro, Yu e sua equipe estão colaborando com instituições de todo o mundo para estudar o viés da IA em patologia em regiões com diferentes demografias, práticas clínicas e configurações laboratoriais. Eles também estão explorando como o FAIR-Path poderia ser adaptado para situações com dados limitados. Outra área de interesse é compreender como o viés impulsionado pela IA contribui para disparidades mais amplas nos cuidados de saúde e nos resultados dos pacientes.
Em última análise, disse Yu, o objetivo é desenvolver sistemas de IA em patologia que apoiem especialistas humanos, fornecendo diagnósticos rápidos, precisos e justos para todos os pacientes.
“Acredito que há esperança de que, se formos mais conscientes e cuidadosos na forma como projetamos sistemas de IA, podemos construir modelos que tenham bom desempenho em todas as populações”, afirmou.
Autoria, financiamento e divulgações
Autores adicionais do estudo incluem Shih-Yen Lin, Pei-Chen Tsai, Fang-Yi Su, Chun-Yen Chen, Fuchen Li, Junhan Zhao, Yuk Yeung Ho, Tsung-Lu Michael Lee, Elizabeth Healey, Po-Jen Lin, Ting-Wan Kao, Dmytro Vremenko, Thomas Roetzer-Pejrimovsky, Lynette Sholl, Deborah Dillon, Nancy U. Lin, David Meredith, Keith L. Ligon, Ying-Chun Lo, Nipon Chaisuriya, David J. Cook, Adelheid Woehrer, Jeffrey Meyerhardt, Shuji Ogino, MacLean P. Nasrallah, Jeffrey A. Golden, Sabina Signoretti e Jung-Hsien Chiang.
O financiamento foi fornecido pelo Instituto Nacional de Ciências Médicas Gerais e pelo Instituto Nacional do Coração, Pulmão e Sangue dos Institutos Nacionais de Saúde (subvenções R35GM142879, R01HL174679), pelo Departamento de Defesa (Prêmio de Desenvolvimento de Carreira do Programa de Pesquisa do Câncer Revisado por Pares HT9425-231-0523), pela Sociedade Americana de Câncer (Subvenção de Pesquisador RSG-24-1253761-01-ESED), por um Prêmio de Pesquisador da Google Research, por um Prêmio de Inovação do Reitor da Harvard Medical School, pelo Conselho Nacional de Ciência e Tecnologia de Taiwan (subvenções NSTC 113-2917-I-006-009, 112-2634-F-006-003, 113-2321-B-006-023, 114-2917-I-006-016), e por uma bolsa de estudante de doutorado da Fundação de Educação Xin Miao.
Ligon foi consultor da Travera, Bristol Myers Squibb, Servier, IntegraGen, L.E.K. Consulting e Blaze Bioscience; recebeu ações da Travera; e tem financiamento de pesquisa da Bristol Myers Squibb e Lilly. Vremenko é cofundador e acionista da Vectorly.
Os autores prepararam o manuscrito inicial e utilizaram o ChatGPT para editar seções selecionadas para melhorar a legibilidade. Após o uso dessa ferramenta, os autores revisaram e editaram o conteúdo conforme necessário e assumem total responsabilidade pelo conteúdo do artigo publicado.
