Autores

7378
3209,312
7379
3209,312

Informações:

Publicações do PESC

Título
Uma Abordagem Não Supervisionada para Reconstrução Justa de Dados
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
4/9/2023
Resumo

A utilização de sistemas inteligentes de tomada de decisão, que se baseiam em conjuntos de dados de indivíduos, pode, se não tratada corretamente, perpetuar vieses preconceituosos presentes nos dados, oriundos de decisões historicamente enviesadas. Esse viés frequentemente está associado a atributos demográficos, como gênero, idade, raça, entre outros. Nesse contexto, pesquisas na área de fairness buscam propor métodos e métricas para identificar e mitigar o impacto negativo que algoritmos de aprendizado de máquina podem causar em grupos historicamente desfavorecidos, especialmente quando trabalham com bases de dados potencialmente enviesadas. Este trabalho apresenta um método de pré-processamento destinado a conjuntos de dados que possuam vieses relacionados à fairness. Por meio de um autoencoder com uma função de custo personalizada, o método é capaz de extrair variáveis latentes desses dados que apresentem um menor grau de injustiça em comparação aos dados originais. Para validar a hipótese do método proposto, foram realizados experimentos com dados reais, e as principais métricas da literatura foram empregadas para medir sua eficiência.

Abstract

The use of intelligent decision-making systems, which rely on individual data sets, can, if not properly addressed, perpetuate prejudiced biases present in the data, stemming from historically biased decisions. This bias is often associated with demographic attributes, such as gender, age, race, among others. In this context, research in the field of fairness seeks to propose methods and metrics to identify and mitigate the negative impact that machine learning algorithms can have on historically disadvantaged groups, especially when dealing with potentially biased data sets. This work introduces a pre-processing method designed for data sets that have biases related to fairness. Through an autoencoder with a customized cost function, the method is capable of extracting latent variables from these data that show a lower degree of injustice compared to the original data. To validate the hypothesis of the proposed method, experiments were conducted with real data, and the main metrics from the literature were used to measure its efficiency.

Arquivo
Topo