Informações:

Publicações do PESC

Título
Um Modelo de Custo para o Processamento de Consultas em Bases de Objetos Distribuídos
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
4/5/2001
Resumo

Técnicas de otimização são essenciais para o processamento eficiente de consultas em bancos de dados baseados em objetos, principalmente na avaliação de expressões de caminho. Tais expressões representam travessias definidas sobre uma seqüência de relacionamentos entre coleções de uma base de objetos e têm sido o foco de inúmeras pesquisas associadas a tecnologias em destaque, como os Sistemas de Gerência de Bases de Dados Objeto-Relacionais e a linguagem XML. A maioria dos trabalhos encontrados na literatura sobre otimização de consultas considera que métricas de custo devem ser utilizadas para orientar a busca por planos de execução com bom desempenho. 

Esta tese propõe um modelo de custo que permite estimar o desempenho das principais estratégias para a avaliação de expressões de caminho em bases de objetos distribuídos. Foram especificadas métricas que representam o custo das operações de entrada/saída (EIS) de dados, de instruções de CPU e de comunicação entre nós. A abrangência do modelo proposto diferencia esta tese dos demais trabalhos, pois é considerada uma ampla gama de aspectos relevantes (i) do modelo de dados 00, como a seletividade de expressões de caminho e a existência de relacionamentos parciais, (ii) do modelo de armazenamento de dados segundo diferentes políticas para agrupamento dos objetos, (iii) do modelo de execução dos algoritmos e (iv) do projeto de distribuição das coleções, levando em conta diferentes técnicas de fragmentação e a alocação dos fragmentos. 

O tratamento de aspectos relativos ao impacto da distribuição de objetos no processamento de expressões de caminho é a principal contribuição apresentada nesta dissertação, a qual visa preencher uma importante lacuna, em função da ausência de trabalhos relacionados.

Abstract

Optimization techniques are essential for the efficient query processing in object-based databases, mainly for the evaluation of path expressions. Such expressions represent a path defined over a sequence of relationships between collections of objects and it has been the focus of numerous researches associated to eminent technologies, such as object-relatlonal databases and the XML language. Most works found in the literature about query optimization considers that cost metrics are used to guide the search of execution plans with good performance. 

This thesis proposes a cost model that allows the estimation of the performance of various strategies for the evaluation of path expressions over distributed-object databases. Metrics were specified to represent the cost of data input/output operations (I/O), CPU instructions, and communication between two nodes. The wideness of the proposed model distinguishes this thesis from other works, since it covers a high number of relevant aspects of (i) the OO data model, such as the selectivity of a path expression and partial participation of the collections in the relationships, (ii) the model of data storage according to diverse policies of object clustering, (iii) the execution model of algorithms, and (iv) the collections distribution project, considering different techniques of fragmentation and the fragments allocation. 

The modeling of aspects related to the impact of object distribution on the evaluation of path expressions is the major contribution presented in this dissertation, which aims to accomplish a great hiatus left due to the absence of related works.

Topo