Autores

4257
Alexandre da Silva Andrade
893,51,1743
4258
893,51,1743
4259
893,51,1743

Informações:

Publicações do PESC

Título
PARTIX: Projeto de Fragmentação de Dados XML
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
21/3/2006
Resumo

O volume de dados de coleções de documentos XML e o tempo de resposta do processamento de consultas em sistemas de bancos de dados (SGBD) com tais coleções tornaram-se pontos críticos para muitas aplicações, especialmente aplicações Web. Uma alternativa interessante para melhorar o desempenho de consultas seria reduzir o tamanho das coleções de documentos XML através de um projeto de fragmentação de dados. Contudo, as definições existentes de fragmentação não são diretamente aplicadas a coleções de documentos XML. Além disso, a ausência de avaliações de desempenho de consultas sobre bases fragmentadas dificulta as decisões de um administrador de dados quanto ao projeto de fragmentação. Esta dissertaçãoapresenta uma formalização para a fragmentação de coleções de documentos XML epropõe uma arquitetura para o processamento de consultas XQuery sobre coleções de dados XML fragmentados. Esta arquitetura foi implementada em um protótipo chamadoPartiX, o qual provê o paralelismo intra-consulta através de uma camada de softwareentre a aplicação e um conjunto de SGBD seqüenciais que adotam a XQuery como linguagem de consulta. O PartiX foi avaliado através de vários conjuntos de dadosexperimentais, e os resultados mostraram um ganho de desempenho de até 72 vezescomparado ao SGBD centralizado.

Abstract

The data volume of collections of XML documents and the response time of query processing in database systems with those collections have become critical issues for many applications, especially for those in the Web. An interesting alternative to improve query processing performance consists in reducing the size of collections of XML documents through data fragmentation design. However, traditional fragmentation definitions do not directly apply to collections of XML documents. Moreover, the absence of performance evaluations of queries on fragmented databases makes it difficult for the data administrator to make decisions on fragmentation design. This dissertation formalizes the fragmentation definition for collections of XML documents and proposes an architecture for XQuery processing on top of fragmented XML data. This architecture was implemented in a system prototype named PartiX, which exploits intra-query parallelism through a software layer between the user application and a set of XML-enabled sequential DBMS modules. We have analyzed several experimental settings, and our results showed a performance improvement of up to a 72 scale up factor against centralized databases.

Arquivo
Topo