Metodologia Baseada em Mineração de Dados Aplicada na Análise da Distribuição Espacial de Agrupamentos de Espécies Vegetais
Autores
5543 |
Luis Alexandre Estevão da Silva
|
2546,312,10
|
5544 |
2546,312,10
|
|
5545 |
2546,312,10
|
Informações:
Publicações do PESC
Com o objetivo de investigar padrões de coocorrências de espécies vegetais, esta tese apresenta a proposta de uma metodologia da mineração de dados para a aplicação em bancos de dados de inventários florísticos em parcelas. A tese avaliou de forma ampla as possibilidades de uso da mineração de dados corroborando nas pesquisas ecológicas com dados de múltiplas espécies, obtendo conhecimento de coocorrências, mesmo em grandes volumes de dados. Para tal, a metodologia proposta identifica padrões de coocorrências com o uso da análise de associação da mineração de dados aplicada a conjuntos frequentes de espécimes. Foi criado um repositório de regras para a persistência do conhecimento gerado, possibilitando a avaliação dos resultados experimentais obtidos por meio de métricas adequadas a esse tipo de aplicação. Estudos de casos foram realizados tornando possível o reconhecimento de padrões de correlações positivas e negativas entre pares e grupos de espécies. A posterior aplicação da análise de agrupamentos foi realizada para identificar a distribuição espacial das espécies presentes nos padrões observados. A tese comprovou por meio da metodologia que a mineração de dados pode ser um recurso útil na Ecologia.
Aiming to investigate patterns of co-occurrences of plant species, this thesis presents a proposed methodology for data mining application in databases floristic inventories in plots. The thesis evaluated comprehensively the possibilities of using data mining in supporting ecological research with data from multiple species, obtaining knowledge of co-occurrences, even in large volumes of data. For such, the proposed methodology identifies patterns of co-occurrences with the use of association analysis of data mining applied to frequent sets of specimens. It was created a repository of rules for the persistence of the knowledge generated, allowing the evaluation of the experimental results using metrics appropriate for this type of application. Case studies were conducted making it possible to recognize patterns of positive and negative correlations between pairs and groups of species. The subsequent application of cluster analysis was performed to identify the spatial distribution of species present in the observed patterns. The thesis demonstrated through the methodology that data mining can be a useful resource in Ecology.