PESC publications Community Detection on Node-Attributed Networks Using Self-Learning and Graph Neural Networks

Authors:

Autores

id	Person role	Person	url
7277	Rodrigo de Sapienza Luna	3178,753
7278	Daniel Ratton Figueiredo (Leader)	3178,753

Informations:

Pesc publication

3096

Title

Community Detection on Node-Attributed Networks Using Self-Learning and Graph Neural Networks

Identification Number

Date

7/3/2023

tituloi

Resumo

Agrupamento de grafos é um problema fundamental, pois encontra aplicações em uma infinidade de cenários diferentes. Enquanto métodos tradicionais têm se concentrado na estrutura da rede, uma variação recente considera o cenário em que os nós possuem atributos que também são informativos. Isso tem desencadeado novos métodos que aproveitam as informações da rede (arestas) e as informações dos nós (atributos) no desenvolvimento de novos algoritmos de agrupamento. Este trabalho propõe um novo framework que utiliza redes neurais de grafos (GNNs) em um processo de autoaprendizagem para resolver esse problema. Cada rodada de treinamento gera representações dos nós para o agrupamento no espaço euclidiano, influenciadas pelos resultados da rodada anterior. Além disso, um grafo de contexto é construído usando o grafo original para refinar ainda mais as representações dos nós. Resultados empíricos demonstram a eficácia de nossa abordagem na extração de informações tanto das arestas da rede quanto dos atributos dos nós em dados sintéticos. Ela supera algoritmos que se concentram exclusivamente na rede ou nos atributos quando as informações são limitadas. Além disso, várias rodadas de aprendizado superam consistentemente o treinamento de uma única rodada, oferecendo desempenho superior ao agrupamento clássico de grafos com GNN. Em conjuntos de dados reais, nossa metodologia mostra superioridade em relação aos métodos de ponta quando os tamanhos dos clusters são balanceados.

Abstract

Graph clustering is a fundamental problem as it finds applications in a myriad of different scenarios. While traditional methods have focused on network structure, a recent variation considers the scenario where nodes have attributes that are also informative. This has triggered novel methods that leverage network information (edges) and node information (attributed) in the design of novel clustering algorithms. This work propose a novel framework that utilizes graph neural networks (GNNs) in a self-learning process to this problem. Each round of training generates node representations for clustering in Euclidean space, influenced by the previous round’s results. Additionally, a context graph is constructed using the original graph to further refine node representations. Empirical results demonstrate the efficacy of our approach in extracting information from both network edges and node attributes in synthetic data. It outperforms algorithms that solely focus on the network or attributes when information is limited. Furthermore, multiple rounds of learning consistently outperform single round training, offering superior performance to classic GNN graph clustering. In real datasets, our methodology shows superiority over state-of-the-art methods when cluster sizes are balanced.

File

3096.pdf

url