Autores

4915
Daniel da Cunha Schmidt
2201,135
4916
2201,135

Informações:

Publicações do PESC

Título
Memória Global para Clusters de Computadores Através de Mecanismo de Kernel
Linha de pesquisa
Arquitetura e Sistemas Operacionais
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
5/10/2010
Resumo
Nesta dissertação é proposto um sistema que implementa um mecanismo no kernel do Linux que oferece às aplicações toda a memória distribuída disponível num cluster de computadores, permitindo a utilização de mais memória do que a localmente disponível em cada computador. A implementação de um protótipo foi feita no kernel 2.6 do Linux, onde o sistema de gerenciamento de memória virtual foi modicado para que falhas de página em um endereço de memória compartilhado buscassem os dados nos outros nós do cluster. Espera-se que aplicações out of core sejam diretamente beneciadas por esse sistema, dado que elas podem trocar a latência de acesso ao disco pela latência da rede. Para não se limitar apenas ao compartilhamento global de memória no cluster, foram implementadas primitivas de sincronização que permitem ao programador realizar a manutenção da coerência dos dados em aplicações paralelas. Para avaliar a implementação do mecanismo proposto, testes foram realizados e seus resultados discutidos.
Abstract
This dissertation proposes a system that implements a mechanism in the Linux kernel that o ers to the application all the available distributed memory in a cluster of computers, allowing the use of more memory than that is available locally at each computer. The implementation of a system was made in the Linux 2.6 kernel, where the system virtual memory management was modi ed so that page faults in a shared memory address will retrieve data on other cluster nodes. It is expexted that out of core applications to be directly bene ted by the system, as they can change disk access latency by network latency. To not be limited only to sharing global memory in the cluster, synchronization primitives were implemented to allow programmers to perform maintenance of data consistency in parallel applications. To evaluate the implementation of the proposed mechanism, tests were performed and their results discussed.
Topo