Informações:

Publicações do PESC

Título
O Ambiente 10+C para a Definição e Execução de Workflows In Silico Através de Serviços Web
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
5/11/2004
Resumo

Cientistas de todo o mundo estão cada vez mais efetuando experimentos científicos totalmente executados e analisados através de computadores. Grande parte dos chamados experimentos in silico correspondem à composição de vários programas em seqüência, onde a saída de um deles é utilizada como entrada de dados do próximo, com a utilização de uni grande número de bancos de dados. Normalmente, esses diversos programas são executados com controle manual pelos cientistas ou através do uso de linguagens de scripts, como Perl. Este tipo de abordagem ajuda na automatização da cadeia de execução, mas possui grande deficiência em questões como flexibilidade, interoperabilidade, clareza, registros de uso, manutenção e evolução.

Workflows científicos representam uma alternativa atraente para a descrição deste tipo de experimento, além de fornecer o apoio necessário ao ciclo de "execução e análise" inerente ao processo de busca de conhecimento. Aliados à tecnologia de serviços Web, pode-se criar um ambiente com independência e interoperabilidade entre as diversas aplicações científicas e os diversos bancos de dados. Apesar do uso bem sucedido dessas tecnologias na área comercial, seu uso em bioinforrnática ainda é incipiente. Neste contexto, o objetivo desta tese é a elaboração, prototipação e avaliação de um ambiente integrado, chamado de Ambiente 10+C, para a definição e execução de experimentos in silico através de workflows científicos compostos de diversas aplicações disponíveis como serviços Web. Um experimento real de bioinformática, chamado MHOkline, foi implementado neste ambiente para validar e confirmas a proposta desta tese e analisar a viabilidade de sua implementação em um sistema de produção.

Abstract

Scientists around the world are developing scientific experiments that are executed and analyzed using computers. A great amount of the so called in silico experinlents correspond to a composition of sequences of several programs where the output of one prograni is used as data input to the next program accessing several databases. Usually, these programs are executed without automation by the scientists or through the use of script languages such as Perl. The script approach helps the automation of the execution process, however it has many deficiencies in terms of flexibility, interoperability, clarity, execution registers, maintenance and evolution.

Scientific workflows represent an attractive alternative to describe this kind of experiments, as well as to give the necessary support to the "Execution and Analysis" cycle, relevant to the process of knowledge discovery. Workflows can create an independent and interoperable environment between the scientific applications and databases, when conlbined with the Web Services technology. In spite of the successful use of these technologies in the business scenario, its use in bioinforniatics is still incipient. h this context, the objective of this thesis is the elaboratioli, prototyping and evaluation of tlie integrated environment called the 10+C Enviroiinient. 10+C aims at the definition and execution of in silico experiments thsough scientific workflows made of several Web services applications. A real bioinformatics experiment named MHOLline was inipleniented in this environment in order to validate and confirm the goals of this thesis and to analyze the viability of its inlplementation in a production system.

Arquivo
Topo