

Person role Person
Reinaldo Viana Alvares


Pesc publication

Algoritmos de Stemming e o Estudo de Proteomas
Research area
Mathematical Optimization
Publication type
Doctoral Thesis
Identification Number
Algoritmos de stemming são úteis na área da Recuperação da Informação (RI) na medida em que geram uma representação concisa para palavras que apontem para o mesmo significado base. Podem ser concebidos por meio do uso de uma lista de prefixos e sufixos, ou de forma menos dependente do idioma, tendo como vantagem a concepção de uma solução que possa servir para diversas linguagens. O estudo de proteínas tem se desenvolvido de forma promissora nos últimos anos, e  diversas informações biológicas estão disponíveis na web. Há informação útil contida nas estruturas primárias e secundárias das proteínas, que no contexto desta tese são tratadas sob um ponto de vista linguístico (MOTOMURA et al., 2013). Neste trabalho são estudados algoritmos de stemming com a proposta de aplicá-los às estruturas de proteínas, buscando entender a interseção entre essas áreas.

Stemming algorithms are useful in the field of information retrieval (IR) as they generate a concise representation for words that point to the same meaning. They can be designed by using a list of prefixes and suffixes or in a language-dependent manner, with the advantage of the solution that can be used for various languages. The study of  proteins has developed promisingly in recent years, and several biological information are available on the web.  There is useful information contained in the primary and secondary structures of proteins, which in the context of this thesis are treated under a linguistic point of view (MOTOMURA et al., 2013). Studied in this work are stemming algorithms with the proposal to apply them to protein structures, in order to understand the intersection between these areas.