Autores

6206
2828,250,1994
6207
2828,250,1994
6208
2828,250,1994

Informações:

Publicações do PESC

Título
Aplicando TILDECRF na Detecção de Homologias Distantes
Linha de pesquisa
Inteligência Artificial
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
30/9/2008
Resumo

Existe hoje em dia uma quantidade significativa de pesquisa envolvendo a detecção de homologias distantes entre sequências de proteínas, um importante problema em Biologia Molecular Computacional. Os melhores resultados são obtidos com o uso de um método probabilístico denominado profile hidden Markou models (pHMM) . Bernardes mostrou que a sensibilidade desses modelos aumenta significativamente ao adicionarmos informações estruturais no momento do treinamento.

Por outro lado, muitos trabalhos têm adotado modelos discriminativos, como os Condztzonal Random Fields (CRF), no lugar de generativos, como são os hidden Markou models (HMM), na solução de problemas de aprendizado de dados sequencias. Em trabalho recente Gutniann e Kersting propuseram unia extensão de CRF, TildeCRF, onde as sequências são formadas por átomos lógicos, incorporando toda a expressividade da lógica de primeira ordem às vantagens dos modelos discriminativos. Os resultados iniciais na predição de estruturas secundárias de proteínas foram promissores.

A principal contribuição desse trabalho foi desenvolver uma metodologia para usar o TildeCRF no problema de detecção de homologias distantes. Três tipos de experimentos foram feitos, cada um com um nível de informação diferente no treinamento. Os resultados foram comparados entre si, confirmando o aumento de acertividade também para o modelo discriminativo quando este dispõe de mais informações. Na comparação com programas específicos para o problema, a saber HMMER e HMMER-STRUCT, o TildeCRF não foi competitivo, mostrando que ainda muitos ajustes são necessários.

Abstract
Arquivo
Topo