Autores

5030
Rodrigo de Moura Barboza
2259,131,2262
5031
2259,131,2262
5032
2259,131,2262

Informações:

Publicações do PESC

Título
Método Semi-Rotulado para Apontar IdentificaçõesConfiáveis em Experimentos de Proteômica Shotgun
Linha de pesquisa
Inteligência Artificial
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
14/6/2011
Resumo
Em proteômica, o método padrão ouro para apontar identificações protéicas confiáveis por espectrometria de massa utiliza uma ferramenta de identificação (e.g., SEQUEST, ProLuCID) juntamente com uma base de dados de sequências de proteínas reais (target) e inexistentes (decoy). As sequencias decoy visam modelar um discriminador a partir de scores obtidos da uma ferramenta de busca. Em seguida, as identificações são ordenadas de acordo com uma distância da superfície de decisão do discriminador e, em geral, é aceita uma fração de 1% de identificações falsas (decoys) no resultado final. Neste cenário, acredita-se que outros 1% de espectros de massa identificados como target são falso-positivos. Neste trabalho, primeiramente mostramos uma falha no método padrão ouro: o resultado real pode não ser condizente com o erro predito; em seguida mostramos como determinar quando esta limitação ocorre e como remediá-la.
Abstract
In proteomics, the gold standard method to point reliable proteins identifications by mass spectrometry uses an identification tool (e.g., SEQUEST, ProLuCID) together with a database of real protein sequences (target) and sequences that don„t exist (decoy). The decoy is used to model a discriminator using the scores given by the search tool. After that, the identifications are ordered according to a distance from discriminator decision surface and, generally, a fraction of 1% of false identifications (decoys) is accepted in the final result. In this scenario, it is believed that other 1% of mass spectra identified as target are false positives. In this work we first show a flaw in the gold standard method: the final result may be not consistent with the predicted error; then we show how to identify when this limitation occurs and how to overcome this.
Topo