Building Deterministic Node Representations from Personalized Pagerank Sequences
Authors:
Autores
Person role | Person | |
---|---|---|
6951 |
3095,753
|
|
6952 |
3095,753
|
Informations:
Pesc publication
Um dos avanços recentes mais importantes na área de aprendizado de máquina foi a capacidade de traduzir dados de alta dimensionalidade para espaços vetoriais de dimensionalidade relativamente baixa, uma técnica conhecida como embedding. Devido à complexidade e diversidade de redes reais, embeddings surgem como um caminho para representar redes por meio de vetores, de preferência capturando informação relevante, e portanto permitindo o uso de modelos clássicos de aprendizado de máquina com dados de redes reais. Uma propriedade interessante é a identidade estrutural dos vértices de uma rede, ou a função que um vértice exerce na rede, independente de sua identidade (rótulo) e da identidade de seus vizinhos na rede. De fato, abordagens recentes geram embeddings de vértices que refletem as suas identidades estruturais. Este trabalho propõe um método para construir representações determinísticas de vértices a partir de sequências geradas com o algoritmo de Personalized PageRank (PPR), que são únicas para cada identidade estrutural, funcionando como uma "assinatura" da função estrutural dos vértices. A capacidade do método de diferenciar as identidades estruturais presentes em diferentes redes é avaliada empiricamente. Também é avaliado o seu desempenho em uma tarefa de classificação de vértices dependente das identidades estruturais dos vértices, comparando-o a métodos propostos anteriormente.
One of the most important recent advances in machine learning is the ability to translate high-dimensional data into relatively low-dimensional vector spaces, a technique known as embedding. Due to the complexity and diversity of real networks, embeddings arise as a way of representing networks as vectors, hopefully capturing relevant information, and therefore creating the possibility of using classic machine learning models on real graph data. An interesting property is the structural identity of network nodes, or the role a node plays in the network, regardless of its identity (label) and the identity of its neighbors. Indeed, recent approaches generate node embeddings that reflect their structural identity. This work proposes a method for building deterministic node representations from Personalized PageRank (PPR) sequences that are unique to each structural identity, effectively acting as a signature of that structural role. We empirically evaluate the capacity of the method to differentiate the structural roles in different networks, as well as its performance on a node classification task that is dependent on the structural identities of nodes, while also comparing with prior approaches.