Informações:

Publicações do PESC

Título
MININGFLOW: Adicionando Semântica a Workflows de Mineração de Texto
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
14/3/2008
Resumo

O processo de descoberta de conhecimento em textos (ou simplesmente KDT) é uma área de pesquisa altamente ativa e de onde emergem uma série de algoritmos e implementações que são desenvolvidos com o intuito de oferecer um apoio mais completo a este processo de descoberta do conhecimento. O projetista de um processo de KDT muitas vezes se depara com uma enorme quantidade de recursos que devem ser gerenciados (algoritmos, programas, parâmetros, resultados obtidos anteriormente, por exemplo). O ciclo de KDT é então modelado através da composição de diversas tarefas em um workflow, que será usado como instrumento base passa a condução dos experimentos. Nesta dissertação, apresentamos o MiningFlow, um ambiente de apoio ao processo de KDT que combina a utilização de tecnologias de workflows com uma ontologia de domínio visando oferecer todo o apoio necessário para a realização de experimentos de mineração de textos. Este suporte se dará no momento da modelagem  de workflows, em sua execução e na análise de resultados obtidos, utilizando-se de recursos semânticos para obter este apoio. Nossa implementação acoplou uma ontologia para o processo de KDT aos Sistemas Gerenciadores de Workflows Científicos Kepler e Taveina para executar os workflows gerados.

Abstract

Text Mining (or Knowledge Discovery in Texts - KDT) is a very active research area and innumerous algorithms have been designed to support its discovery cycle. The designer is faced with several resources (e.g. algorithms, programs, parameters, datasets, results visualization) to manage. The KDT cycle is thus designed by composing several tasks in a workflow, which is used as a basis for conducting experirnents. In this paper we present MiningFlow, a KDT environment that combines workflow technology with a domain ontology to support workflow modeling and result visualization to offer semantic support for KDT. Our implementation couples a KDT ontology to Kepler and Taverna workflow platform to execute KDT workflows.

Arquivo
Topo