Informações:

Publicações do PESC

Título
Autoencoder Variacional e Redes Adversárias Generativas para o Reconhecimento de Faces a Partir de Uma Única Imagem por Pessoa
Linha de pesquisa
Computação Gráfica
Tipo de publicação
Tese de Doutorado
Número de registro
Data da defesa
15/7/2025
Resumo

Aplicações reais de sistemas de reconhecimento facial, principalmente na área de segurança, frequentemente dispõem de apenas uma imagem por indivíduo para identificação em ambientes não controlados, onde fatores como iluminação, pose, expressão e oclusão variam significativamente. Esse cenário, conhecido como “amostra única por pessoa” (SSPP - Single Sample Per Person), ainda representa um desafio significativo para os métodos atuais de reconhecimento facial. Com o intuito de abordar esse problema, propõe-se o arcabouço AD-VAE (Adversarial Disentangling Variational Autoencoder) , que combina técnicas de autoencoders variacionais (VAE - Variational Autoencoder) com redes adversariais generativas (GAN -  Generative Adversarial Network) para a geração de protótipos faciais que preservam a identidade do indivíduo. A arquitetura AD-VAE é composta por quatro redes neurais: codificador, decodificador, gerador e discriminador multitarefa. O método proposto foi avaliado em bases de dados amplamente utilizadas na literatura, incluindo AR, E-YaleB, CAS-PEAL, FERET e LFW, obtendo resultados superiores aos métodos do estado da arte, com taxas de reconhecimento que variam de 84,9% a 99,6%. Os resultados obtidos demonstram a eficácia e robustez da abordagem, bem como seu potencial para aplicações práticas e futuras pesquisas na área.

Abstract

Real-world facial recognition systems, especially in the security domain, often rely on only a single image per individual for identification in uncontrolled environments, where factors such as lighting, pose, expression, and occlusion vary significantly. This scenario, known as Single Sample Per Person (SSPP), still poses a significant challenge for current facial recognition methods. To address this problem, we propose the AD-VAE (Adversarial Disentangling Variational Autoencoder) framework, which combines Variational Autoencoder (VAE) techniques with Generative Adversarial Networks (GAN) to generate identity-preserving facial prototypes. The AD-VAE architecture is composed of four neural networks: encoder, decoder, generator, and a multitask discriminator. The proposed method was evaluated on widely used benchmark datasets, including AR, E-YaleB, CAS-PEAL, FERET, and LFW, achieving superior performance compared to state-of-the-art methods, with recognition rates ranging from 84.9% to 99.6%. The obtained results demonstrate the effectiveness and robustness of the approach, as well as its potential for practical applications and future research in the field.

Arquivo
Topo