Reexecução Determinística de Programas Distribuídos em MPI
Autores
1616 |
Alberto de Fontes Tavares Neto
|
679,163
|
1617 |
679,163
|
Informações:
Publicações do PESC
Reexecução Determinística de Programas Distribuídos em MPI
Alberto de Fontes Tavares Neto
Março/1998
Orientadores: | Valmir Carneiro Barbosa Lúcia Maria A. Drummond | |
|
Esta tese consiste na implementação e comparação de duas estratégias que
permitem a reexecução determinística de programas distribuídos, que se utilizam
da biblioteca de comunicação MPI (message-passing interface).
Um programa distribuído apresenta um comportamento não determínistico,
ou seja, reexecuções do mesmo podem produzir computações distintas.
Este comportamento faz com que as técnicas de depuração tradicionais usadas em
programas sequenciais não funcionem para eles. Um depurador para programas
distribuídos precisa prover um mecanismo que garanta a reexecução determinística
dos mesmos.
As duas estratégias implementadas tiveram seus desempenhos comparados para um
conjunto de três aplicações gerais. A primeira estratégia grava informações sobre
todas as mensagens que podem causar não determinismo. Já a segunda, faz uma
seleção prévia sobre quais mensagens devem realmente ser gravadas, através da
anexação de informações de controle nas mensagens do usuário.
Deterministic Reexecution of MPI Distribuited Programs
Alberto de Fontes Tavares Neto
March/1998
Advisores: | Valmir Carneiro Barbosa
Lucia Maria A. Drummond | |
Department: Systems Engineering and Computer Science |
In this thesis two techniques for tracing and replaying MPT message passing programs were implemented and analyzed. A distributed program may present a nondeterministic behavior. Thus, two executions of the same program mav produce different results. This behavior makes impossible the use of traditional sequential debugging techniques. A debugger for distributed programs shall provide a mechanism that allows the deterministic reexecution of them. Experiments were performed with three parallel aplications in order to compare the implemented techniques. The first technique traces all the messages that can cause nondeterminism. The second one selects only messages which really need to be traced, by appending control information onto user messages.