Autores

4198
299,1857
4199
299,1857

Informações:

Publicações do PESC

Título
Detecção de Linhas de Pesquisa em Artigos Científicos
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
16/10/2009
Resumo

Este trabalho propõe desenvolver uma ferramenta para identificar linhas de pesquisa em um corpus de publicações científicas, de forma a facilitar pesquisadores, professores e estudantes a realizarem buscas por material para suas pesquisas. A ferramenta deverá ser capaz de processar o corpus, extraindo os dados das publicações de forma automatizada e organizar os artigos dentro das linhas de pesquisa identificadas, mostrando sua evolução no tempo e os autores e publicações mais influentes.

O trabalho foi baseado em técnicas de Detecção e Rastreamento de Tópicos (TDT) e na implementação da ferramenta BuzzTrack. Para realização dos testes, foi criado um corpus de publicações científicas, contendo dez anos de artigos de três congressos da área de banco de dados.

Além da apresentação e análise dos resultados da avaliação, são discutidas as limitações do trabalho e sugeridas algumas melhorias que podem ser futuramente realizadas na ferramenta, bem como são apontados novos horizontes de pesquisa.

Abstract

This work proposes the development of a tool to identify research lines on a corpus of scientific publications, in order to facilitate researchers, teachers and students to conduct searches for material to help on their research. The tool should be able to process the corpus, extracting data from publications in an automated manner and organize articles within the research lines identified, showing its evolution over time, the authors and most influential publications.

The work was based on techniques of Topic Detection and Tracking (TDT) and on the implementation of the BuzzTrack tool. For testing, was created a corpus of scientific publications with ten years of articles from three meetings in the database research area.

In addition to the presentation and analysis of the evaluation results, the limitations of the work are discussed, some improvements that can be done in the tool are suggested and new research horizons are pointed out.

Arquivo
Topo