Autores

4841
Clarissa Netto Vilela
2164,51,2320
4842
2164,51,2320
4843
2164,51,2320

Informações:

Publicações do PESC

Título
Processamento de Consultas sobre Bases XML Distribuídas em um Ambiente Peer-to-Peer
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
1/7/2010
Resumo
O gerenciamento de dados em ambientes Peer-to-Peer (P2P) representa uma tarefa complexa e desafiante devido à natureza dinâmica da abordagem P2P e à presença de dados complexos, principalmente descritos no padrão XML. Por questões de escalabilidade e com o objetivo de preservar a autonomia de um ambiente P2P, um dos maiores objetivos de um sistema P2P é permitir que usuários realizem consultas de forma transparente sobre os diversos pontos distribuídos pela rede. Um sistema P2P deve lidar com importantes questões, tais como a localização dos dados relevantes e o processamento de consultas, onde o sistema P2P deve ser capaz de descobrir os pontos que podem contribuir com dados relevantes à execução da consulta. Para contribuir para a solução deste problema, esta dissertação apresenta uma metodologia para o processamento de consultas XQuery sobre bases de dados XML distribuídas em um ambiente P2P, inspirada na metodologia proposta por Figueiredo (2007), que contempla as etapas de decomposição da consulta submetida, incluindo sua representação na álgebra TLC; localização dos dados; otimização global; execução e consolidação dos resultados. Para implementar a metodologia proposta, estendemos a arquitetura proposta por Figueiredo (2007) baseada em um Mediador com Adaptadores. O Mediador realiza as modificações necessárias na consulta original de forma a tornar a distribuição das bases de dados transparente ao usuário. Diferentes técnicas para a etapa de localização dos dados relevantes foram implementadas no protótipo, com o objetivo de avaliar experimentalmente a nossa metodologia de forma a determinar qual técnica melhor se adapta para o processamento de consultas XQuery distribuídas em um ambiente P2P. 
Abstract
Data management in P2P systems is a challenging and difficult problem considering the dynamic nature of P2P networks and the presence of complex data, particularly described in the XML standard. For scalability reasons and in order to preserve the autonomy of a P2P environment, one of the major goals in a P2P system is to enable users to pose queries in a transparent way over the distributed peers in the P2P network. A P2P system should deal with important issues, such as relevant data localization and query processing, where a P2P system should be able to find the peers that can contribute with relevant data to the query execution. To contribute to the solution of this problem, this work presents a methodology for XQuery query processing over distributed XML databases on a P2P approach, inspired by the methodology proposed by Figueiredo (2007), which consists on the steps of query decomposition, including the query’s TLC algebra representation; data localization; global optimization; global query execution and final result assembly.  To implement the proposed methodology, we extend the architecture proposed by Figueiredo (2007) based on a Mediator with Wrappers. The Mediator performs all the necessary modifications in the original query in order to make the data distribution transparent to the user. Different techniques for the step of localization of relevant data have been implemented in the prototype, in order to experimentally evaluate our methodology to determine which technique is best suited for XQuery query processing over distributed XML databases on a P2P approach.
Topo