Apr 26, 2023
ChatGPT
Crédito: FlashMovie/Getty Images Executar um programa de triagem de drogas é como uma encenação
Crédito: FlashMovie/Getty Images
Executar um programa de triagem de drogas é como encenar um enorme coquetel - e ouvir os procedimentos. Em coquetéis, há muita conversa fiada, mas apenas algumas conversas significativas. Da mesma forma, em programas de triagem de drogas, as fracas interações droga-alvo superam em muito as instâncias de ligação de alta afinidade.
Imagine se você tivesse que ouvir todas as brincadeiras de um coquetel. Certamente, isso seria tedioso. Agora, considere o quão pior seria avaliar cada interação droga-alvo em uma triagem típica de drogas. Ora, isso esgotaria até mesmo o ouvinte mais paciente — o típico sistema de inteligência artificial (IA).
Infelizmente, os sistemas de IA convencionais levam muito tempo para filtrar dados sobre as interações entre candidatos a medicamentos e alvos de proteínas. A maioria dos sistemas de IA calcula a estrutura tridimensional de cada proteína-alvo a partir de sua sequência de aminoácidos e, em seguida, usa essas estruturas para prever com quais moléculas de drogas ela irá interagir. A abordagem é exaustiva, mas lenta.
Para avançar, pesquisadores do MIT e da Tufts University criaram uma abordagem computacional alternativa baseada em um tipo de algoritmo de IA conhecido como modelo de linguagem grande. Esses modelos - um exemplo bem conhecido é o ChatGPT - podem analisar grandes quantidades de texto e descobrir quais palavras (ou, neste caso, aminoácidos) têm maior probabilidade de aparecer juntas. O grande modelo de linguagem desenvolvido pela equipe MIT/Tufts é conhecido como ConPLex. Ele pode combinar proteínas-alvo com potenciais moléculas de drogas sem ter que executar a etapa computacionalmente intensiva de calcular as estruturas das moléculas.
Detalhes sobre o ConPLex apareceram em 8 de junho na PNAS, em um artigo intitulado "A aprendizagem contrastiva no espaço de linguagem de proteínas prevê interações entre drogas e alvos de proteínas". O ConPLex pode alavancar os avanços em modelos de linguagem de proteína pré-treinados ("PLex") e empregar uma coembedding contrastiva ancorada em proteína ("Con") para superar as abordagens de última geração.
“O ConPLex alcança alta precisão, ampla adaptabilidade a dados não vistos e especificidade contra compostos chamariz”, escreveram os autores do artigo. “Ele faz previsões de ligação com base na distância entre as representações aprendidas, permitindo previsões na escala de enormes bibliotecas de compostos e do proteoma humano”.
Os pesquisadores então testaram seu modelo examinando uma biblioteca de cerca de 4.700 moléculas de drogas candidatas quanto à sua capacidade de se ligar a um conjunto de 51 enzimas conhecidas como proteínas quinases.
Dos principais resultados, os pesquisadores escolheram 19 pares de drogas e proteínas para testar experimentalmente. Os experimentos revelaram que dos 19 hits, 12 tinham forte afinidade de ligação (na faixa nanomolar), enquanto quase todos os outros possíveis pares de drogas e proteínas não teriam afinidade. Quatro desses pares se ligam com afinidade subnanomolar extremamente alta (tão forte que uma pequena concentração de droga, da ordem de partes por bilhão, inibe a proteína).
Enquanto os pesquisadores se concentraram principalmente na triagem de medicamentos de moléculas pequenas neste estudo, eles agora estão trabalhando na aplicação dessa abordagem a outros tipos de medicamentos, como anticorpos terapêuticos. Esse tipo de modelagem também pode ser útil para executar telas de toxicidade de possíveis compostos de drogas, para garantir que eles não tenham efeitos colaterais indesejados antes de testá-los em modelos animais.
"Este trabalho atende à necessidade de triagem in silico eficiente e precisa de potenciais candidatos a medicamentos", disse Bonnie Berger, pesquisadora do MIT e uma das autoras sênior do novo estudo. “[Nosso modelo] permite telas em larga escala para avaliar efeitos fora do alvo, reaproveitamento de drogas e determinar o impacto de mutações na ligação de drogas”.
"Parte da razão pela qual a descoberta de drogas é tão cara é porque tem altas taxas de falha", observou Rohit Singh, pesquisador do MIT e um dos principais autores do estudo. "Se pudermos reduzir essas taxas de falha dizendo de antemão que essa droga provavelmente não funcionará, isso poderá ajudar muito a reduzir o custo da descoberta de drogas".