A biblioteca de peptídeos quantificáveis ​​preenche a lacuna para a descoberta e validação de biomarcadores baseados em proteômica no câncer de mama

Notícias

LarLar / Notícias / A biblioteca de peptídeos quantificáveis ​​preenche a lacuna para a descoberta e validação de biomarcadores baseados em proteômica no câncer de mama

Jul 15, 2023

A biblioteca de peptídeos quantificáveis ​​preenche a lacuna para a descoberta e validação de biomarcadores baseados em proteômica no câncer de mama

Relatórios Científicos volume 13,

Scientific Reports volume 13, Número do artigo: 8991 (2023) Citar este artigo

164 acessos

3 Altmétrica

Detalhes das métricas

A proteômica baseada em espectrometria de massa (MS) é amplamente utilizada para a descoberta de biomarcadores. No entanto, muitas vezes, a maioria dos candidatos a biomarcadores da descoberta são descartados durante os processos de validação. Tais discrepâncias entre a descoberta e validação de biomarcadores são causadas por vários fatores, principalmente devido às diferenças na metodologia analítica e nas condições experimentais. Aqui, geramos uma biblioteca de peptídeos que permite a descoberta de biomarcadores em configurações iguais ao processo de validação, tornando assim a transição da descoberta para a validação mais robusta e eficiente. A biblioteca de peptídeos começou com uma lista de 3393 proteínas detectáveis ​​no sangue de bancos de dados públicos. Para cada proteína, peptídeos substitutos favoráveis ​​para detecção em espectrometria de massa foram selecionados e sintetizados. Um total de 4.683 peptídeos sintetizados foram adicionados em amostras puras de soro e plasma para verificar sua quantificabilidade em um tempo de execução de cromatografia líquida-MS/MS de 10 minutos. Isso levou à biblioteca PepQuant, que é composta por 852 peptídeos quantificáveis ​​que cobrem 452 proteínas do sangue humano. Usando a biblioteca PepQuant, descobrimos 30 biomarcadores candidatos para câncer de mama. Entre os 30 candidatos, nove biomarcadores, FN1, VWF, PRG4, MMP9, CLU, PRDX6, PPBP, APOC1 e CHL1 foram validados. Ao combinar os valores de quantificação desses marcadores, geramos um modelo de aprendizado de máquina que prevê o câncer de mama, mostrando uma área média sob a curva de 0,9105 para a curva característica de operação do receptor.

As proteínas do sangue são analitos valiosos para o diagnóstico e prognóstico de várias doenças1. Em particular, a aplicação de plataformas proteômicas às proteínas do sangue tem recebido atenção crescente tanto da academia quanto da indústria clínica2. Com o desenvolvimento tecnológico da espectrometria de massas e dos métodos de análise de dados, as plataformas proteômicas baseadas em MS ganharam mais profundidade e força quantitativa para identificar e quantificar proteínas3. Consequentemente, os estudos empregaram métodos baseados em tandem mass tag (TMT), métodos de quantificação sem marcação e métodos de aquisição independente de dados (DIA) para quantificar um grande número de proteínas de amostras complexas para identificar proteínas e isoformas expressas diferencialmente como potenciais candidatos para novos biomarcadores3,4,5. No entanto, apenas uma pequena porcentagem dos biomarcadores candidatos foi identificada como eficaz durante a fase de validação1. Isso também foi observado no número de biomarcadores aprovados e utilizados clinicamente. Em comparação com as mais de 4.300 proteínas plasmáticas identificadas, apenas cerca de 100 biomarcadores foram aprovados ou liberados pelo FDA, apesar de muitos estudos de descoberta2,6,7. A discrepância entre as fases de descoberta e validação pode ser devida a diferenças no tamanho, tipo e número da amostra, protocolo de preparo e equipamentos1,8. Entre os processos entre as fases de descoberta e validação, o tamanho, o tipo e o número da amostra podem ser melhor controlados na fase de desenho experimental. No entanto, as diferenças nos métodos de preparação para diferentes equipamentos não podem ser resolvidas por planejamento experimental. Para um processo de descoberta típico, uma abordagem proteômica shot-gun não direcionada usando espectrometria de massa de alta resolução com depleção abundante de proteínas, pré-fracionamento e um longo tempo de execução de gradiente (1 a 3 h) é usada para maximizar o número de proteínas perfiladas. Em contraste, o pipeline de validação é baseado em uma abordagem direcionada em soro puro ou plasma via cromatografia líquida-triplo quadrupolo MS tandem (LC-MS/MS), que é mais focado na medição quantitativa9. As diferenças entre os processos de descoberta e validação aumentam o tempo e os custos para a descoberta de biomarcadores clinicamente utilizáveis.

Para superar esse problema, estudos anteriores sugeriram o uso de protocolos que permitem análises reprodutíveis em diferentes tipos de equipamentos, como nanoflow e microflow LC9,10. Esses estudos se concentraram mais na geração de um candidato a biomarcador adequado em uma configuração de descoberta típica usando uma abordagem não direcionada. Isso pode encurtar o tempo da fase de descoberta; no entanto, não reduz a lacuna entre a descoberta e a validação.