Informações:

Publicações do PESC

Título
Processamento Paralelo de Consultas de Apoio à Decisão em GRIDS
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
17/3/2008
Resumo

Consultas de apoio à decisão, materializadas comumente como consultas OLAP (On-Line Analytical Processing) são caracterizadas pelo elevado consumo de tempo e processamento e podem beneficiar-se de computação de alto desempenho. Esta dissertação apresenta a solução GParGRES, uma camada de software para gerenciar a execução de consultas de natureza tipicamente OLAP, de forma paralela e distribuída em ambientes de grids (grades). GParGRES é uma evolução da solução de agrupamento de banco de dados ParGRES: provê paralelismo inter - e intra-consulta, de forma não intrusiva aos SGBD e bases de dados pré-existentes e em um ambiente tipicamente heterogêneo e distribuído, a grade. A evolução de agrupamento de bancos de dados para grades computacionais apresenta desafios para o processamento paralelo de consultas OLAP. Este pode ser tratado em duas camadas de software; uma no nível de grade, com a distribuição de tarefas entre seus sítios e atenção especial ao balanceamento de carga e composição de resultados, e outra no nível de agrupamentos, com a redistribuição de tarefas entre seus nós. GParGRES foi concebido na forma de serviços para grade compatíveis com os padrões existentes e avaliado com base no benchmark TPC-H, que representa consultas OLAP, na plataforma Grid'5000, localizada na França.

Abstract

Decision support queries, usually denoted as OLAP (On-Line Analytical Processing) queries are typically time and CPU consurning and can take advantage of high perfomance computing. This dissertation presents GParGRES solution, a software layer in order to manage distributed and parallel OLAP query execution on grid environments. GParGRES is an evolution to the database cluster solution ParGRES: it provides inter and intra-query parallelism in a non intrusive DBMS and databases approach and inside a typically distributed and heterogeneous environment, the grid. The evolution from database clusters to computing gsid states challenges to OLAP queries processing. It could be dealt within two sofhvare layers; one within grid level, with task distribution among sites and special case on load balancing and result composition, and another one at cluster level, with a11 appropriate task distribution through a11 its nodes. GParGRES was conceived according to existing grid services patterns, and has been implemented in Grid'5000, a grid platfom initiative located in France and evaluated with the execution of TPC-H benchmark queries, which represent OLAP queries.

Arquivo
Topo