Informações:

Publicações do PESC

Título
APUAMA: Processamento de Consultas Olap com Atualizações Concorrentes em Um Agrupamento de Banco de Dados
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
20/3/2006
Resumo

O agrupamento de banco de dados (DBC) é constituído por diversos sistemas de gerenciamento de banco de dados (SGBD) seqüenciais instalados em nós de um agrupamento de PCs. Os SGBDs são controlados por uma camada de software responsável por prover o paralelismo de consultas. O DBC fornece uma solução de baixo custo e de alto desempenho para processamento de consultas. Usando tanto o paralelismo inter-consulta quanto o intraconsulta sobre bases de dados replicadas, o DBC pode acelerar individualmente o processamento de consultas e aumentar a vazão do sistema. No entanto, não existe DBC que combine o paralelismo inter e intra-consulta enquanto trata transações de atualização. O C-JDBC é um DBC de sucesso que oferece o paralelismo inter-consulta e controla consistência entre as réplicas da base de dados, mas não pode acelerar o tempo de execução de consultas pesadas, típicas de ambientes OLAP. Nesta dissertação, propomos o Apuama, que adiciona o paralelismo intra-consulta ao C-JDBC. O resultado é uma solução em software livre que comporta tanto aplicações OLAP quanto de OLTP. O Apuama foi avaliado em um agrupamento de 32 PCs executando consultas OLAP do benchmark TPC-H usando o PostgreSQL como SGBD. Nossos testes mostram que o Apuama proporciona aceleração de consultas e escalabilidade de vazão superlinear em ambientes apenas de leitura. Além disso, apresenta desempenho com ganhos mesmo sob operações de atualização de dados.

Abstract

Database clusters (DBCs) consist of many sequential database management systems (DBMSs) installed on a PC cluster. The DBMSs are controlled by a middleware responsible for providing query parallelism. DBCs provide a low cost solution for high performance query processing. By using either inter- or intra-query parallelism on replicated data, they can accelerate the query processing individually and increase system thoughput on DBMS. However, there is no DBC that coinbines inter- and intra-query parallelism while supporting update transactions. C-JDBC is a successful DBC that offers inter-query parallelism and controls database replica consistency but cannot accelerate individual heavy-weight queries, typical of OLAP enviroments. In this dissertation, we propose the Apuama, which adds intra-query parallelism to C-JDBC. The result is an open-source solution that supports both OLAP and OLTP applications. We evaluate Apuama on a 32-mode PC cluster running OLAP queries of the TPC-H benchmark using PostgreSQL as DBMS. Our tests show that the Apuama yields super-linear speedup and scale-up thoughput with read-only environments. Furthermore, it yields good perfomance under data update operations.

Arquivo
Topo