Processamento Paralelo para Detecção de Homologia Remota com MAP/REDUCE
Autores
5513 |
Carlos Eduardo Santanna da Silva
|
2527,790
|
5514 |
2527,790
|
Informações:
Publicações do PESC
A detecção de homologia remota é uma das atividades mais importantes nos estudos de genética comparativa. Essas atividades demandam recursos computacionais de alto desempenho, em função do volume de dados que a ser processado. O paradigma de programação Map/Reduce vem sendo utilizado como alternativa às ferramentas atualmente existentes para a obtenção de processamento alto desempenho nesta área. O uso desse paradigma, no entanto, tem gerado problemas de balanceamento de carga durante a execução das atividades, gerando desperdício de recursos do cluster de computadores em que estão sendo executadas. Essa dissertação apresenta uma solução para a melhora do balanceamento de carga em atividades de detecção de homologia remota em ambientes Map/Reduce. Uma abordagem para fragmentação de dados é proposta e os resultados experimentais obtidos são bastante promissores.
The remote homology detection is one of the most important tasks in comparative genomic studies. These tasks demand high performance computational resources due to the huge amounts of data to be processed. The Map/Reduce paradigm has been used as an alternative to the traditional tools employed in this area for achieving high performances. The use of this paradigm, however, has load balance issues when running such activities, wasting resources in computer clusters. This dissertation presents a solution for the improvement of load balancing on remote homology detection tasks in Map/Reduce environments. A new data partitioning approach is proposed and experimental results are very promising.