Soutenance de thèse de Guillaume Renton le jeudi 8 juillet 2021 à 10h à l'Université de Rouen Normandie

Date : 08/07/2021

Cette thèse, réalisée à l'Université de Rouen Normandie au sein de l'équipe Apprentissage du LITIS s'intitule :

"Réseaux de neurones sur graphes : analyses et contributions"

Du fait des conditions sanitaires actuelles, la soutenance s'effectuera en visioconférence. Vous êtes donc invités à assister à la soutenance de thèse via les identifiants Zoom suivants :

Lien Zoom :
https://zoom.us/j/91619339126
Meeting ID : 916 1933 9126

Vous êtes également convié au pot qui suivra. Celui ci se déroulera en extérieur, à l'arrière du bâtiment.

La soutenance aura lieu devant le jury composé de
M. Jean-Yves RAMEL, Professeur, Université de Tours - LIFAT, Rapporteur
M. Josep LLADOS, Professeur, Université de Barcelone - CVC, Rapporteur
Mme Elisa FROMONT, Professeur, Université de Rennes - IRISA, Examinatrice
M. Nicolas THOME, Professeur, CNAM - CEDRIC lab, Examinateur
M. Luc BRUN, Professeur, Université de Caen - GREYC, Examinateur
M. Sébastien ADAM, Professeur, Université de Rouen Normandie - LITIS, Directeur de thèse
M. Pierre HÉROUX, Maître de conférences, Université de Rouen Normandie - LITIS, Encadrant de thèse

M. Benoît GAÜZÈRE, Maître de conférences - INSA Rouen Normandie, LITIS, Encadrant de thèse

Résumé
Bien que théorisés il y a une quinzaine d'années, l'intérêt de la communauté scientifique pour les réseaux de neurones sur graphes n'a connu un réel essor que très récemment. De tels modèles visent à transposer les capacités d'apprentissage de représentation inhérentes aux réseaux de neurones profonds sur des données de type graphes, via l'apprentissage d'états cachés associés aux nœuds du graphe. Ces états cachés sont calculés et mis à jour en fonction des informations contenues dans le voisinage de chacun des nœuds.

Ce récent intérêt pour les réseaux de neurones sur graphes (GNN) a conduit à une "jungle" de modèles et de méthodes, rendant le domaine de recherche parfois confus. Historiquement, deux principales stratégies ont été explorées : les réseaux spatiaux et les réseaux spectraux. Les réseaux spatiaux, parfois appelés "message passing neural network", sont basés sur le calcul d'un message agrégeant l'information contenue dans le voisinage de chacun des nœuds. Ce message est ensuite utilisé afin de mettre à jour les états cachés des différents nœuds du graphe. Les réseaux spectraux quant à eux sont basés sur la théorie spectrale des graphes et reposent donc sur le Laplacien du graphe. La décomposition en valeurs/vecteurs propres du Laplacien permet notamment de définir une transformée de Fourier sur graphe ainsi qu'une transformée inverse. À partir de ces transformées, différents filtrages peuvent être appliqués sur le graphe, obtenant des résultats similaires au filtrage sur une image ou sur un signal.

Dans cette thèse, nous commençons par introduire une troisième catégorie, appelée spectral-rooted spatial convolution. En effet, certaines méthodes récentes prennent racine dans le domaine spectral tout en évitant le calcul de la décomposition en vecteurs propres du Laplacien. Cette troisième catégorie nous amène à nous poser la question de la différence fondamentale entre les réseaux de neurones spatiaux et réseaux de neurones spectraux. Nous répondons à cette question par la proposition d'un modèle général unifiant les deux stratégies, montrant notamment que les modèles spectraux sont un cas particulier des modèles spatiaux. Ce cadre unifié nous a par ailleurs permis de proposer une
analyse spectrale de plusieurs modèles de GNN populaires dans la communauté scientifique, à savoir GCN, GIN, GAT, Chebnet et CayleyNet. Cette analyse montre que les modèles spatiaux sont limités aux filtrages passe-bas et passe-haut, tandis que les modèles spectraux sont capables de réaliser n'importe quel type de filtres. Ces résultats sont ensuite retrouvés avec la présentation d'un problème jouet, montrant dans un premier temps la limitation des modèles spatiaux à définir des filtres passe-bande et l'importance que peut revêtir l'utilisation de tels filtres.

Ces résultats nous ont amenés à proposer une méthode capable de réaliser n'importe quel type de filtrage, tout en limitant le nombre de paramètres du réseau. En effet, bien que les modèles spectraux soient capables de réaliser tout type de filtrage, l'ajout d'un nouveau filtre requiert l'ajout d'une nouvelle matrice de poids dans le réseau de neurones. Afin de réduire le nombre de paramètres, nous proposons l'adaptation des Depthwise Separable Convolution aux graphes via une méthode intitulée Depthwise Separable Graph Convolution Network. Cette méthode a été évaluée à la fois en apprentissage transductif et en apprentissage inductif, et obtient des résultats supérieurs à l'état de
l'art sur les datasets testés.

Enfin, nous proposons une méthode définie dans le domaine spatial afin de prendre en compte les attributs d'arcs. En effet, cette problématique a été peu étudiée par la communauté scientifique, et le nombre de méthodes proposant d'inclure ces informations est très réduit. La nôtre, intitulée Edge Embedding Graph Neural Network, propose de projeter les attributs d'arcs dans un nouvel espace via un premier réseau de neurones, avant d'utiliser les caractéristiques extraites dans un GNN. Cette méthode est évaluée dans une problématique particulière de détection de symboles dans un graphe.

Abstract

Although theorised about fifteen years ago, the scientific community's interest for graph neural networks has only really taken off recently. Those models aim to transpose the representation learning capacity inherent in deep neural network onto graph data, via the learning of hidden states associated with the graph nodes. These hidden states are computed and updated according to the information contained in the neighborhoud of each node.

This recent interest for graph neural networks (GNNs) has led to a "jungle" of models and frameworks, making this field of research sometimes confusing. Historically, two main strategies have been explored : the spatial GNNs on one side and the spectral GNNs on the other side. Spatial GNNs, sometimes also called Message Passing Neural Network, are based on the computation of a message which agregates the information contained in the neighborhoud of each node. On the other side, spectral GNNs are based on the spectral graph theory and thus on the graph Laplacian. The eigendecomposition of the graph Laplacian allows to define a graph Fourier transform and its inverse. From these transforms, different filters can be applied on the graph, leading to similar results than filtering on images or signals.

In this thesis, we begin by introducing a third category, called spectral rooted spatial convolution. Indeed, some recent methods are taking root in the spectral domain while avoiding to compute the eigendecomposition of the graph Laplacian. This third category leads to question about the fundamental difference between spectral and spatial GNNs. We answer this question by proposing a general model unifying both strategies, showing notably that spectral GNNs are a particular case of spatial GNNs. This unified model also allowed us to propose a spectral analysis of some popular GNNs in the scientific communitic, namely GCN, GIN, GAT, ChebNet and CayleyNet. This analysis shows that spatial models are limited to low-pass and high-pass filtering, while spectral models can produce any kind of filters. Those results are corroborated on a toy problem, showing in the first instance the limitation of spatial models to define pass-band filters, and the importance of designing such filters.

Those results have led us to propose a method allowing any kind of filter, while limiting the network's number of parameters. Indeed, even though spectral models are able to design any kind of filtering, each new filter require the add of a new weight matrix in the neural network. In order to reduce the number of parameters, we propose to adapt Depthwise Separable Convolution to graphs through a method called Depthwise Separable Graph Convolution Network. This method is evaluated on both transductive and inductive learning, outperforming state-of-the-arts results.

Finally, we propose a method defined in the spatial domain in order to take into account edge attributes. Indeed, this issue has been little studied by the scientific community, and the number of methods allowing to include edge attributes is very small. Our proposal, called Edge Embedding Graph Neural Network, consists in embedding edge attributes into a new space through a first neural network, before using the extracted features in a GNN. This method is evaluated on a particular problem of symbol detection in a graph.