Um Ambiente Computacional para Proteômica
Autores
4771 |
2262,163
|
|
4774 |
2262,163
|
Informações:
Publicações do PESC
Título
Um Ambiente Computacional para Proteômica
Linha de pesquisa
Inteligência Artificial
Tipo de publicação
Tese de Doutorado
Número de registro
Data da defesa
31/3/2010
Resumo
O presente trabalho introduz novas metodologias computacionais para analisar dados de proteômica shotgun. A primeira, o PatternLab for proteomics, cria ambiente computacional capaz de apontar proteínas diferencialmente expressas entre perfis protéicos, analisa dados proteômicos sob a luz do Gene Ontology, aponta tendências em experimentos temporais, e gera facilmente diagramas Venn com áreas proporcionais. A segunda contribuição, intitulada Charge Prediction Machine (CPM), infere a carga de íons precursores com base no espectro de massa de baixa resolução em tandem (1000) obtido por dissociação de transferência de elétron; o conhecimento da carga é necessário para a identificação protéica. O CPM utiliza abordagem inovadora inspirada no discriminante bayesiano; comparativamente, enquanto nossa abordagem acertou 98% da carga dos precursores em um gabarito, a única metodologia existente (Charger, Thermo Fisher, San José – CA) acertou 86%. A terceira contribuição, intitulada YADA, introduz algoritmo para deconvolução de espectros de alta resolução e acurácia (<50 ppm). Quando comparado ao comercialmente disponível (o Xtract da Thermo Fisher, San Jose, CA), YADA mostrou-se 700% mais rápido e aumentou em 20% o número de peptídeos identificados. Em seguida, introduz-se uma nova metodologia experimental / computacional para aquisição de dados de proteômica shotgun intitulado Extended Data Independent Analysis (XDIA). Quando testado em um lisado de levedura, aumentaram-se em 250% os espectros identificados e 30% no número de peptídeos únicos quando comparado à metodologia estado da arte e largamente adotada: data-dependent analysis.
Abstract
This thesis contributes with methodologies for analyzing shotgun proteomic data. Firstly, we introduce PatternLab for proteomics, a computational environment that can pinpoint differentially expressed proteins when analyzing data from complex peptide mixtures, leverage the Gene Ontology to aid in experimental interpretation, discriminate trends in time-course experiments, and easily generate approximately area proportional Venn diagrams. Secondly, we introduce Charge Prediction Machine (CPM). CPM infers precursor ion charge based on its low resolution tandem mass spectrum (~1000) acquired using electron transfer dissociation; knowledge of the precursor charge is necessary for protein identification. CPM relies on a new approach inspired in the Bayesian discriminant function; it correctly classified 98% of the precursor charges in a test database while the only competing methodology (Charger, Thermo Fisher, San Jose – CA) correctly classified 86%. Thirdly, we introduce YADA, a new algorithm for deconvolution of high-resolution, high-accuracy mass spectra (<50 ppm). When compared to the commercially available solution (Xtract, Thermo Fisher, San Jose, CA), YADA identified 20% more unique peptides and was 700% faster. Lastly, we introduce a new experimental / computational approach for shotgun data acquisition called Extended Data Independent Analysis (XDIA). When tested on a yeast lysate, the number of identified spectra and unique peptides increased by 250% and 30%, respectively, as when compared to the state-of-the-art and widely adopted data-dependent analysis.
Arquivo