Aplicando TILDECRF na Detecção de Homologias Distantes
Autores
6206 |
2828,250,1994
|
|
6207 |
2828,250,1994
|
|
6208 |
2828,250,1994
|
Informações:
Publicações do PESC
Existe hoje em dia uma quantidade significativa de pesquisa envolvendo a detecção de homologias distantes entre sequências de proteínas, um importante problema em Biologia Molecular Computacional. Os melhores resultados são obtidos com o uso de um método probabilístico denominado profile hidden Markou models (pHMM) . Bernardes mostrou que a sensibilidade desses modelos aumenta significativamente ao adicionarmos informações estruturais no momento do treinamento.
Por outro lado, muitos trabalhos têm adotado modelos discriminativos, como os Condztzonal Random Fields (CRF), no lugar de generativos, como são os hidden Markou models (HMM), na solução de problemas de aprendizado de dados sequencias. Em trabalho recente Gutniann e Kersting propuseram unia extensão de CRF, TildeCRF, onde as sequências são formadas por átomos lógicos, incorporando toda a expressividade da lógica de primeira ordem às vantagens dos modelos discriminativos. Os resultados iniciais na predição de estruturas secundárias de proteínas foram promissores.
A principal contribuição desse trabalho foi desenvolver uma metodologia para usar o TildeCRF no problema de detecção de homologias distantes. Três tipos de experimentos foram feitos, cada um com um nível de informação diferente no treinamento. Os resultados foram comparados entre si, confirmando o aumento de acertividade também para o modelo discriminativo quando este dispõe de mais informações. Na comparação com programas específicos para o problema, a saber HMMER e HMMER-STRUCT, o TildeCRF não foi competitivo, mostrando que ainda muitos ajustes são necessários.