Desafiando o domínio do Google DeepMind em biologia computacional, pesquisadores da Harvard Medical School revelaram o popEVE, um novo modelo de inteligência artificial projetado para diagnosticar doenças genéticas raras com maior especificidade.

Publicada hoje na Nature Genetics, a ferramenta integra dados da população humana para reduzir drasticamente as previsões de falsos positivos, uma falha persistente em modelos existentes como o AlphaMissense.

Ao calibrar a gravidade das variantes em todo o proteoma, o popEVE identificou com sucesso 123 novos candidatos. genes para distúrbios do desenvolvimento, oferecendo um avanço diagnóstico para pacientes que permaneceram sem solução apesar de testes extensivos. teimosamente baixo, com algumas coortes vendo apenas 25% dos probandos receberem um diagnóstico genético definitivo.

Os médicos são frequentemente confrontados com uma vasta gama de “Variantes de Significado Incerto” (VUS), alterações genéticas cujo impacto na saúde humana é desconhecido.

Essa ambiguidade cria um gargalo diagnóstico, onde identificar a variante específica responsável pela condição de um paciente se torna um esforço demorado e muitas vezes infrutífero. A interpretação atual muitas vezes não consegue distinguir entre variantes que causam transtornos graves de início na infância e aquelas com efeitos modestos que se manifestam apenas mais tarde na vida, uma distinção crítica para os cuidados pediátricos.

De acordo com o artigo de pesquisa, o popEVE aborda essa lacuna de precisão ao impor um limite mais rigoroso para patogenicidade. Nos testes, o modelo demonstrou uma redução dramática nas previsões de falsos positivos na população em geral, sinalizando apenas 11% dos indivíduos como portadores de variantes graves.

Este nível de especificidade é uma melhoria acentuada em relação às ferramentas de última geração existentes; por exemplo, o AlphaMissense do Google DeepMind categoriza aproximadamente 44% da população em geral como portadora de variantes igualmente graves em limites de recall comparáveis. Ao filtrar esse ruído, o popEVE permite que os médicos se concentrem nas variantes com maior probabilidade de serem causais.

A eficácia do modelo foi rigorosamente validada em uma metacoorte de 31.058 pacientes com transtornos graves de desenvolvimento (SDDs), provenientes do estudo Deciphering Developmental Disorders (DDD), GeneDx e Radboud University Medical Center.

Dentro deste extenso conjunto de dados, popEVE’s o limiar de gravidade de alta confiança (definido em-5,056) revelou um enriquecimento de variantes patogênicas de 15 vezes – cinco vezes maior do que outros métodos líderes, como o PrimateAI-3D. Este poder estatístico permitiu que o modelo fornecesse com sucesso um diagnóstico para aproximadamente um terço dos casos que anteriormente desafiavam a explicação sob protocolos de testes padrão.

Talvez o mais significativo para o campo da genética médica seja a capacidade do modelo de descobrir associações de doenças inteiramente novas. A análise identificou 123 novos genes candidatos ligados a distúrbios do desenvolvimento, 119 dos quais foram identificáveis no nível de variante única. href=”https://creativecommons.org/licenses/by-nc-nd/4.0″target=”_blank”>CC BY-NC-ND 4.0)

Notavelmente, 31 desses genes foram recuperados usando apenas variantes missense – uma categoria de mutação que normalmente requer dados corroborantes de perda de função (LoF) para ser considerada diagnóstica. Esta capacidade sugere que o popEVE pode detectar sinais patogênicos que os métodos tradicionais baseados em enriquecimento não detectam.

A validação dessas descobertas já está produzindo resultados clínicos. Desde o início do estudo, 25 dos 123 novos genes candidatos foram confirmados de forma independente por outros laboratórios e formalmente adicionados ao banco de dados de Gene para Fenótipo de Transtorno do Desenvolvimento (DDG2P). Além disso, quando aplicado a mutações missense de novo (DNMs), o modelo sinalizou 7% das variantes em casos como graves, em comparação com apenas 0,5% em controles saudáveis, demonstrando um alto grau de separação entre patogênicos e benignos. variações.

Debora Marks, professora de biologia de sistemas na Harvard Medical School, enfatizou que a ferramenta foi projetada para traduzir esses ganhos estatísticos em resultados clínicos tangíveis. “Nosso objetivo era desenvolver um modelo que classificasse variantes por gravidade da doença – fornecendo uma visão priorizada e clinicamente significativa do genoma de uma pessoa.”

Calibrando o Proteoma

Modelos de última geração anteriores, incluindo EVE e AlphaMissense, são excelentes na classificação de variantes dentro de um único gene, mas têm dificuldade para comparar a gravidade entre diferentes genes. Consequentemente, pontuações altas aparecem frequentemente para variantes que perturbam a função proteica, mas não causam necessariamente doenças graves num contexto humano.

popEVE resolve isto combinando dados evolutivos profundos (usando EVE e o modelo de linguagem ESM-1v) com restrições da população humana. Para determinar variantes naturalmente toleradas, a equipe utilizou dados do UK Biobank (UKBB) e do gnomAD v2.

Um processo gaussiano latente é empregado para calibrar as pontuações evolutivas em relação a esta variação humana observada, criando uma pontuação unificada de “deletéria”. Através deste ajuste, torna-se possível um grande avanço clínico: a análise “singleton”, onde as variantes causais podem ser priorizadas usando apenas o exoma da criança.

Os métodos tradicionais normalmente requerem sequenciação “trio” (pais + criança) para identificar mutações de novo, um processo que é muitas vezes proibitivamente caro ou logisticamente impossível.

Mafalda Dias, investigadora do Centro de Regulação Genómica, destacou as implicações práticas desta capacidade.”As clínicas nem sempre têm acesso ao DNA dos pais e muitos pacientes vêm sozinhos. O popEVE pode ajudar esses médicos a identificar mutações causadoras de doenças.”

AlphaMissense desafiadora

O AlphaMissense do Google DeepMind, lançado em setembro de 2023, estabeleceu anteriormente um novo padrão ao categorizar 89% de todas as variantes missense possíveis. No entanto, a equipa de Harvard argumenta que, embora o AlphaMissense seja preciso em termos de estabilidade proteica, falta-lhe a calibração clínica necessária para o diagnóstico.

A análise estatística mostra que o AlphaMissense prevê uma média de cinco variantes “patogénicas” por pessoa média, enquanto o popEVE prevê menos de uma. Essa discrepância é vital para ambientes clínicos, onde a previsão excessiva pode levar a diagnósticos errados e ansiedade desnecessária.

O artigo  PrpopEVE observa ainda:

“popEVE identifica 442 genes em uma coorte de transtorno de desenvolvimento, incluindo evidências de 123 novos candidatos, muitos sem a necessidade de enriquecimento em toda a coorte.”

“Finalmente, mostramos que essas descobertas podem ser reproduzidas a partir da análise do apenas os exomas dos pacientes, demonstrando que o popEVE fornece um novo caminho para a análise genética em situações onde os métodos tradicionais falham.”

Apesar dos ganhos de desempenho, o popEVE continua sendo uma ferramenta de pesquisa e ainda não recebeu autorização da FDA para uso como um dispositivo de diagnóstico independente. O Marks Lab está disponibilizando o modelo por meio de um portal popEVE e de um repositório popEVE, contrastando com a natureza muitas vezes proprietária das ferramentas comerciais de saúde de IA.

Aplicações futuras vão além do diagnóstico até a descoberta de medicamentos, já que o modelo pode identificar específicos mecanismos patogênicos dentro de estruturas proteicas.

Rose Orenbuch, pesquisadora do Marks Lab, expressou otimismo sobre a integração da ferramenta em fluxos de trabalho clínicos. “Sinto que estamos um passo mais perto de que o popEVE seja útil no dia-a-dia de tentar diagnosticar doenças genéticas com mais rapidez.”

Categories: IT Info