Calendário de Eventos
|
"Federated Learning Assisted Framework to Periodically Identify User Communities in Urban Space"
Cláudio Diego Teixeira de Souza
Data: 30 de abril de 2025, quarta-feira
Horário: 15h00 (horário de Brasília)
Sala virtual: meet.google.com/ukd-gsms-fgi
Banca Examinadora:
Prof. José Ferreira de Rezende - PESC/COPPE/UFRJ (Presidente da Banca e Orientador)
Prof. Carlos Alberto Vieira Campos - UERJ (Orientador)
Prof. Diego Leonel Cadette Dutra - PESC/COPPE/UFRJ
Prof. Miguel Elias Mitre Campista - PEE/COPPE/UFRJ
Profa. Aline Marins Paes Carvalho - UFF
Resumo:
A identificação de indivíduos com comportamentos e padrões de mobilidade semelhantes tornou-se essencial para melhorar o funcionamento dos serviços urbanos. Entretanto, como esses padrões podem variar com o tempo, essa identificação precisa ser feita periodicamente. Além disso, uma vez que os dados de mobilidade expressam a rotina dos indivíduos, a privacidade deve ser garantida. Neste trabalho, propomos um framework para detectar e agrupar periodicamente indivíduos com semelhanças de comportamento em comunidades. Para isso, criamos um modelo autoencoder para extrair features de mobilidade espaço-temporal de dados brutos do usuário em intervalos periódicos. Usamos a Federated Learning (FL) como abordagem de treinamento para preservar a privacidade e aliviar os custos de treinamento e comunicação. Para determinar o número de comunidades sem arriscar um valor arbitrário, comparamos as escolhas de dois métodos probabilísticos, o Critério de Informação de Akaike (AIC) e o Critério de Informação Bayesiano (BIC). Como as comunidades são atualizadas periodicamente, também analisamos o impacto de amostras antigas no framework proposto. Por fim, comparamos o desempenho de nossa solução baseada em FL com uma abordagem de treinamento centralizado. Analisamos as métricas de similaridade e dissimilaridade em amostras de mobilidade e o tempo de contato dos indivíduos em três cenários diferentes. Nossos resultados indicam que a AIC supera a BIC ao escolher o número de comunidades, embora ambas satisfaçam as métricas de avaliação. Também descobrimos que o uso de amostras mais antigas beneficia cenários espaço-temporais mais complexos. Por fim, não foram detectadas perdas significativas quando comparadas a uma abordagem de treinamento centralizado, reforçando as vantagens de usar o método baseado em FL.