Autores

6147
2590,299,200
6148
2590,299,200
6149
2590,299,200

Informações:

Publicações do PESC

Título
Extração de Acrônimos e Seus Significados com Modelos Ocultos de Markov
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
19/3/2008
Resumo

Esta dissertação apresenta uma solução para a extração automática de acrônimos e seus significados de texto não estruturado. Baseado em um conjunto de regras definidas através de expressões regulares, a solução identifica no texto uma lista de termos que podem ser acrônimos e outra lista com expressões que podem ser seus respectivos significados. Uma função probabilística, baseada em modelos ocultos de Markov, calcula a probabilidade de cada uma dessas expressões emergirem de um termo. O significado de um termo consiste na expressão que obtiver a maior probabilidade. Os resultados alcançados sugerem que tal função probabilística entre o acrônimo e seu significado existe e que HMM consiste num método adequado para sua implementação, sendo esta a principal contribuição deste trabalho.

Abstract

This dissertation proposes a solution for automatically extracting acronydmeaning pairs from unstructured text. Based on a set of rules developed with regular expressions, the solution identifies within the text a list of acronym candidates and another list of expressions that could be their respective meaning. A probabilistic function irnplemented with Hidden Markov Models associates the correct tuple , based on the premise that the correct meaning is the expression within the list with the highest probability to emerge from the acronym. The results achieved suggest that this probabilistic function exists and that Hidden Markov Models is an adequate method to implement it. This function consists in this dissertation major contribution.

Arquivo
Topo