NOMAD: Um Sistema Operacional Eficiente para Clusters de Uni e Multiprocessadores
Autores
1787 |
Eduardo Souza de Albuquerque Pinheiro
|
758,161
|
1788 |
Ricardo Bianchini
(Orientador) |
758,161
|
Informações:
Publicações do PESC
NOMAD: Um Sistema Operacional Eficiente para Clusters de Uni e Multiprocessadores
Eduardo Souza de Albuquerque Pinheiro
Agosto/1999
Orientador: | Ricardo Bianchini | |
|
Neste trabalho apresentamos Nomad, um sistema operacional distribuído
eficiente para clusters de estações uni e multiprocessadoras. Nomad inclui várias
das características necessárias a um sistema distribuído moderno: escalabilidade,
distribuição eficiente da demanda por recursos no cluster, escalonamento eficiente
de aplicações sequenciais, paralelas e distribuídas, entrada e saída distribuída,
detecção e recuperação de falhas, proteção entre processos e compatibilidade retroativa.
Alguns dos mecanismos utilizados para alcançar tais características podem ser
encontrados em outros sistemas, tais como o checkpointing e a migração de processos.
No entanto, Nomad se destaca por gerenciar todos os recursos do cluster eficientemente,
não apenas a utilização dos processadores como geralmente acontece nos sistemas dirigidos
ao balanceamento de carga. Além disso, nosso sistema é bastante escalável, uma vez que
não envolve mensagens adicionais no gerenciamento de recursos e na tolerância a falhas,
aproveitando o tráfego natural imposto por servidores distribuídos de armazenamento de
dados. Nossa avaliação de um protótipo de Nomad mostra que ele é bastante eficiente em termos dos seus mecanismos básicos e que o padrão de acessos a arquivos no nosso sistema de arquivos distribuído permite um balanceamento de carga eficiente e escalável.
NOMAD: An Efficient Operating System for Clusters of Uni and Multiprocessors
Eduardo Souza de Albuquerque Pinheiro
August/1999
Advisor: | Ricardo Bianchini | |
Department: Systems Engineering and Computer Science |
In this thesis we propose Nomad, an efficient operating system for clusters of uni and/or multiprocessors. Nomad includes several important characteristics for modern cluster-oriented operating systems: scalability, efficient resource management across the cluster, efficient scheduling of parallel and distributed applications, distributed I/O, fault detection and recovery, protection, and backward compatibility. Some of the mechanisms used by Nomad, such as process checkpointing and migration, can be found in previously proposed systems. However, our system stands out for its strategy for disseminating information across the cluster and its efficient management of all cluster resources, not just processor utilization as in previous load-balancing systems. In addition, Nomad is highly scalable as it does not involve any extra messages for resource management, distributed scheduling, and fault tolerance, taking advantage of the I/O traffic associated with its distributed file system. Our evaluation of a prototype implementation of Nomad shows that its basic mechanisms are efficient and that the pattern of file accesses in our distributed file system allows for efficient and scalable load balancing. Our main conclusion is that the complete implementation of Nomad will be very efficient and will be an interesting platform for future research on operating systems for clusters of workstations.