Publicações do PESC Reconhecimento Visual Atencional

Autores

id		url
1824	Sérgio Exel Gonçalves	749,190,200
1825	Luiz Adauto Pessoa (Orientador)	749,190,200
1826	Luís Alfredo Vidal de Carvalho (Co-orientador)	749,190,200

Informações:

Publicações do PESC

784

Título

Reconhecimento Visual Atencional

Número de registro

Data da defesa

30/3/1999

tituloi

Resumo

A visão é um processo ativo, onde as informações importantes para o comportamento são seletivamente adquiridas. Nesta tese propomos um modelo de reconhecimento visual atencional no qual uma fóvea simulada com alta resolução é dirigida para regiões de maior interesse por um processo de atenção seletiva. A região de interesse da imagem bruta é inicialmente representada por um mapa space-variant de respostas das células complexas, ou de contornos orientados. Esta representação é processada por um Sistema de Decisão que tenta reconhecer a imagem com as informações parciais adquiridas. Caso a informação disponível seja insuficiente para garantir o reconhecimento, um Módulo Atencional entra em ação para determinar a próxima região de interesse de onde extrair informações. A próxima foveação é baseada em informações da imagem (bottom-up) e do conjunto de modelos armazenados no sistema (top-down) combinadas de acordo com uma estratégia atencional adotada pelo sistema. O processo de foveação continua até que a imagem seja reconhecida ou seja atingido um número limite de foveações. Diversas estratégias atencionais foram investigadas, aplicando-se o modelo ao reconhecimento de faces e outros objetos em extensas simulações, que permitem avaliar qualitativamente e quantitativamente os resultados de cada estratégia atencional. Os resultados mostram ser factível reconhecer faces e outros objetos com margens de erros comparáveis ou menores que outros modelos tradicionais, porém a um custo computacional bem mais baixo, utilizando a representação space-variant associada a uma estratégia atencional adequada.

Abstract

Vision is an active process where behaviorally important information is selectively gathered. We present a model of visual recognition in wich the high- resolution fovea is deployed to interesting regions by selective attention processes. The raw image is initially represented by a space-variant complex-cell, or oriented edge, map. This transformed input is processed by a decision system which attempts to recognize the image given partial information. In the more typical case where the available information is insufficient to support recognition, an attentive foveation system is engaged which is responsible for determining the subsequent image region of interest. The next foveation is based on both bottom-up information from the image and top-down information from the set of stored models, combined according to the attentional strategy in execution. The foveation process continues until the object is recognized or a maximum number of foveations is reached. Several attentional strategies were investigated as the model is applied to the task of recognition of faces and other objects. Both qualitative and quantitative evaluations of the attentional strategies are provided. Results show the feasibility of recognition of faces and objects with a error rate comparable or lower to other traditional models, but with much reduced computational costs, a consequence of the space-variant representation used associated with efficient attentional strategy.

Arquivo

784.pdf

url

Reconhecimento Visual Atencional

Autores

Informações:

Publicações do PESC

Menu principal