Autores

6139
2804,47
6140
2804,47

Informações:

Publicações do PESC

Título
Mineração de Dados Via Máquina de Vetores Suporte com Suavização Hiperbólica
Linha de pesquisa
Otimização
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
22/2/2008
Resumo

Este trabalho é destinado a mostrar o processo de Mineração de Dados com enfoque no principal processo de mineração que é a classificação dos dados. Mostra todas as etapas do processo de mineração, apresentando em cada uma delas as principais características e técnicas aplicadas. Dentro do processo de classificação, é apresentada uma nova abordagem para a resolução do problema linear de Máquina de Vetor Suporte (SVM) como parte de um fluxo no processo de Mineração de Dados. O modelo matemático considerado conduz a uma formulação que tem uma característica significante, de ser não-diferenciável. Para superar esta dificuldade, o método de resolução proposto adota uma estratégia de suavização usando uma função suavizadora especial pertencente à classe de funções C", a Suavização Hiperbólica. A solução final é obtida através da resolução de ma sequência de subproblemas de otimização diferenciáveis irrestritos, definidos em um espaço com dimensão pequena, que gradativamente se aproximam do problema original. A utilização dessa técnica, denominada Suavização Hiperbólica, permite superar as principais dificuldades presentes no problema original. Um algoritmo simplificado contendo somente o essencial do método é apresentado e os resultados computacionais são comparados ao mais conhecido software de classificação via SVM, o SVMLight.

Abstract

This work is intended to show the Data Mining procedure with focus on the main task of rnining which is the data classification. It is shown all stages of the mining procedure, presenting for each one the key features and techniques applied. In the classification task, a new approach to solving the problem of linear Support Vector Machine (SVM). The mathematical modeling of this problem leads to a formulation which has de signincant characteristic of being non-differentiable. In order to overcome these difficulties, the resolution method proposed adopts a smoothing strategy using a special C" differentiable class function, called Hyperbolic Smoothing. The final solution is obtained by solving a sequence of low dimension differentiable unconstrained optimization sub problems, which gradually approach the original problem. The use of this technique, called Hyperbolic Smoothing, dlows the main difficulties presented by the original problem to be overcome. A simplified algorithm containing only the essential of the method is presented and the results are compared to d e one of the best know software for SVM classification, de SVMLight.

Arquivo
Topo