Integração de Banco de Dados em Ambientes de Grid
Autores
6195 |
João Victor Pap Almeida
|
160,135,2824
|
6196 |
160,135,2824
|
|
6197 |
160,135,2824
|
Informações:
Publicações do PESC
Sistemas de Grid podem ser classificados em dois grandes grupos: grids computacionais (Computational Grids) e grids de dados (DataGrids). Muitos sistemas têm sido desenvolvidos voltados para grids computacionais, porém muito poucos têm estado voltados para grids de dados. Algumas soluções vêm sendo desenvolvidas para orquestração de sistemas de arquivos e poucos focam na orquestração de bases de dados. Sistemas tais como AMGA, GREIC e OGSA-DAI, este último desenvolvido no contexto do Open Grid Forum (OGF), têm procurado oferecer soluções para a disponibilização de dados locais em ambientes de grid e integração de bancos de dados heterogêneos e dispersas geograficamente. Normalmente, estas soluções exigem: (I) que o usuário conheça a localização física das tabelas locais a cada nó do grid ou conheça detalhes sobre o sistema gerenciador de bancos de dados; ou (2) que os dados sejam importados das bases de dados, localizadas em cada nó, para um servidor. Neste trabalho propomos a utilização de tabelas virtuais definidas pelos administradores dos nós do grid para tornar transparente o acesso aos dados pelos usuários. Cada nó mantém sua individualidade e pode disponibilizar os dados no grid através de tabelas virtuais. Este esquema traz algumas vantagens: permite que o administrador defina permissões e políticas de acesso aos diversos usuários de cada sítio; permite que dados mantenham-se confidenciais; oferece ao usuário uma única visão dos dados; "esconde" do usuário a organização física das tabelas, o que pode reforçar a segurança dos dados; disponibiliza SGBDs heterogêneos em ambientes de grid; pode ser utilizado para armazenar maiores quantidades de dados, visto que as tabelas físicas estão distribuídas.
Grid systems have been1 recently utilized by researchers worldwide. Several hardware and software infrastructures make it possible to develop the so-called e-Science. These systems can be classified in two big groups: computational grids and datagrids. Many systems have been developed whose focus is on computational grids, however very few have been dedicated to datagrids. Some solutions have been developed for the orchestration of file systems and few concentrate on the orchestration of databases. Systeins such as AMGA, GREIC and OGSA-DAI (the latter one developed in the context of the Open Grid Forum - OGF), offer solutions that make local data available in grid environments, or integrate heterogeneous and distributed databases. Most often, these solutions require that the user knows the physycal location of the table or the kind of database being utilised in the remote grid node. In this work we offer another solution that makes the access to different databases transparent to the user. We use virtual tables defined and configured by grid site administrators to "virtually" represent the physical tables located at different grid sites. Each grid site can maintain its own view of the data, but there is one virtual table that connects all physical tables. This scheme can bring some advantages: it allows the definition of user permissions and access policies for each grid site; it allows data to be kept confidential; it offers to the grid user one single view of the data; it hides from the grid user the physical organization and location of data tables what can reinforce data security and confidentiality; integrate heterogeneous databases; it can be utilized to store larger tables, since physical tables are distributed.