Ícone do site Blog do Hurb

Nova ferramenta de AI classifica os efeitos de 71 milhões de mutações ‘missense’  e promete mudar o setor da saúde e longevidade!

saude-tecnologia-inteligencia-artificial

Descobrir as causas profundas das doenças é um dos maiores desafios da genética humana. Com milhões de mutações possíveis e dados experimentais limitados, ainda é um mistério quais delas podem causar doenças. Este conhecimento é crucial para um diagnóstico mais rápido e para o desenvolvimento de tratamentos que salvam vidas.

Hoje, estamos lançando um catálogo de mutações “missenses” onde os pesquisadores podem aprender mais sobre o efeito que elas podem ter. Variantes missense são mutações genéticas que podem afetar a função das proteínas humanas. Em alguns casos, podem causar doenças como fibrose cística, anemia falciforme ou câncer.

O catálogo AlphaMissense foi desenvolvido usando AlphaMissense, nosso novo modelo de IA que classifica variantes missense. Num artigo publicado na Science , mostramos que categorizou 89% de todas as 71 milhões de possíveis variantes missense como provavelmente patogénicas ou provavelmente benignas. Por outro lado, apenas 0,1% foram confirmados por especialistas humanos.

As ferramentas de IA que podem prever com precisão o efeito das variantes têm o poder de acelerar a investigação em campos que vão da biologia molecular à genética clínica e estatística. Experimentos para descobrir mutações causadoras de doençassão caros e trabalhosos – cada proteína é única e cada experimento deve ser projetado separadamente, o que pode levar meses. Ao utilizar previsões de IA, os investigadores podem obter uma pré-visualização dos resultados de milhares de proteínas de cada vez, o que pode ajudar a priorizar recursos e acelerar estudos mais complexos.

Disponibilizamos gratuitamente todas as nossas previsões para a comunidade de pesquisa e abrimos o código do modelo do AlphaMissense .

AlphaMissense previu a patogenicidade de todas as 71 milhões de variantes missense possíveis. Classificou 89% – prevendo que 57% eram provavelmente benignos e 32% eram provavelmente patogênicos.

O que é uma variante missense?

Uma variante missense é uma substituição de uma única letra no DNA que resulta em um aminoácido diferente dentro de uma proteína. Se você pensar no DNA como uma linguagem, mudar uma letra pode mudar uma palavra e alterar completamente o significado de uma frase. Nesse caso, uma substituição altera qual aminoácido é traduzido, o que pode afetar a função de uma proteína.

Uma pessoa média carrega mais de 9.000 variantes missense . A maioria é benigna e tem pouco ou nenhum efeito, mas outras são patogênicas e podem perturbar gravemente a função das proteínas. As variantes missense podem ser usadas no diagnóstico de doenças genéticas raras, onde algumas ou mesmo uma única variante missense podem causar doenças diretamente. Eles também são importantes para o estudo de doenças complexas, como o diabetes tipo 2, que pode ser causado por uma combinação de muitos tipos diferentes de alterações genéticas.

A classificação de variantes missense é um passo importante na compreensão de quais dessas alterações proteicas podem dar origem à doença. Das mais de 4 milhões de variantes missense que já foram observadas em humanos, apenas 2% foram anotadas como patogênicas ou benignas pelos especialistas, cerca de 0,1% de todas as 71 milhões de variantes missense possíveis. As restantes são consideradas “variantes de significado desconhecido” devido à falta de dados experimentais ou clínicos sobre o seu impacto. Com o AlphaMissense, temos agora a imagem mais clara até o momento, classificando 89% das variantes usando um limite que rendeu 90% de precisão em um banco de dados de variantes de doenças conhecidas.

Patogênico ou benigno: como AlphaMissense classifica variantes

AlphaMissense é baseado em nosso modelo inovador AlphaFold , que previu estruturas para quase todas as proteínas conhecidas pela ciência a partir de suas sequências de aminoácidos. Nosso modelo adaptado pode prever a patogenicidade de variantes missense que alteram aminoácidos individuais de proteínas.

Para treinar o AlphaMissense, ajustamos o AlphaFold nos rótulos que distinguem variantes observadas em populações humanas e de primatas intimamente relacionadas. As variantes comumente observadas são tratadas como benignas e as variantes nunca observadas são tratadas como patogênicas. AlphaMissense não prevê a mudança na estrutura da proteína após mutação ou outros efeitos na estabilidade da proteína. Em vez disso, utiliza bases de dados de sequências de proteínas relacionadas e contexto estrutural de variantes para produzir uma pontuação entre 0 e 1, classificando aproximadamente a probabilidade de uma variante ser patogénica. A pontuação contínua permite que os usuários escolham um limite para classificar variantes como patogênicas ou benignas que atenda aos seus requisitos de precisão.

Uma ilustração de como AlphaMissense classifica variantes missense humanas. Uma variante missense é inserida e o sistema de IA a classifica como patogênica ou provavelmente benigna. AlphaMissense combina contexto estrutural e modelagem de linguagem de proteínas e é ajustado em bancos de dados de frequência de populações de variantes humanas e primatas.

AlphaMissense alcança previsões de última geração em uma ampla gama de benchmarks genéticos e experimentais, tudo sem treinamento explícito em tais dados. Nossa ferramenta superou outros métodos computacionais quando usada para classificar variantes do ClinVar, um arquivo público de dados sobre a relação entre variantes humanas e doenças. Nosso modelo também foi o método mais preciso para prever resultados de laboratório, o que mostra que é consistente com diferentes formas de medir a patogenicidade.

AlphaMissense supera outros métodos computacionais na previsão de efeitos de variantes missense.
Esquerda:

Comparando o desempenho do AlphaMissense e de outros métodos na classificação de variantes do arquivo público Clinvar.
Os métodos mostrados em cinza foram treinados diretamente no ClinVar e seu desempenho neste benchmark é provavelmente superestimado, uma vez que algumas de suas variantes de treinamento estão contidas neste conjunto de testes.
À direita: gráfico comparando o desempenho do AlphaMissense e de outros métodos na previsão de medições de experimentos biológicos.

Construindo um recurso comunitário

AlphaMissense baseia-se no AlphaFold para promover a compreensão mundial das proteínas. Há um ano, lançámos 200 milhões de estruturas proteicas previstas através do AlphaFold – que está a ajudar milhões de cientistas em todo o mundo a acelerar a investigação e a preparar o caminho para novas descobertas. Estamos ansiosos para ver como o AlphaMissense pode ajudar a resolver questões em aberto no cerne da genômica e em toda a ciência biológica.

Disponibilizamos gratuitamente as previsões do AlphaMissense para a comunidade científica. Juntamente com o EMBL-EBI, também os estamos tornando mais utilizáveis ​​para pesquisadores por meio do Ensembl Variant Effect Predictor .

Além de nossa tabela de pesquisa de mutações missense, compartilhamos as previsões expandidas de todas as possíveis 216 milhões de substituições de sequências de aminoácidos únicas em mais de 19.000 proteínas humanas. Também incluímos a previsão média para cada gene, que é semelhante a medir a restrição evolutiva de um gene – isto indica o quão essencial o gene é para a sobrevivência do organismo.

Exemplos de previsões AlphaMissense sobrepostas em estruturas previstas AlphaFold (vermelho = previsto como patogênico, azul = previsto como benigno, cinza = incerto). Os pontos vermelhos representam variantes missense patogênicas conhecidas, os pontos azuis representam variantes benignas conhecidas do banco de dados ClinVar.
Esquerda:
 proteína HBB. Variantes desta proteína podem causar anemia falciforme.
À direita: proteína CFTR. Variantes desta proteína podem causar fibrose cística. 

Acelerando a pesquisa sobre doenças genéticas

Um passo fundamental na tradução desta pesquisa é colaborar com a comunidade científica. Temos trabalhado em parceria com a Genomics England para explorar como estas previsões podem ajudar a estudar a genética das doenças raras. A Genomics England cruzou as descobertas da AlphaMissense com dados de patogenicidade variante previamente agregados com participantes humanos. A avaliação deles confirmou que nossas previsões são precisas e consistentes, fornecendo outra referência do mundo real para a AlphaMissense.

Embora as nossas previsões não sejam concebidas para serem utilizadas diretamente na clínica – e devam ser interpretadas com outras fontes de evidência – este trabalho tem o potencial de melhorar o diagnóstico de doenças genéticas raras e ajudar a descobrir novos genes causadores de doenças.

Em última análise, esperamos que o AlphaMissense, juntamente com outras ferramentas, permita aos investigadores compreender melhor as doenças e desenvolver novos tratamentos que salvem vidas.

What’s your Reaction?
+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
Sair da versão mobile