Etude d’un réseau neuronal convolutif (CNN) particulier : the “wavelet scattering network”

De Ensiwiki
Aller à : navigation, rechercher


Etude d’un réseau neuronal convolutif (CNN) particulier : the “wavelet scattering network”

Labo LJK
Equipe LJK/Géométrie-Image/CVGI
Encadrants Valerie.Perrier@univ-grenoble-alpes.fr

Thème général

Les réseaux neuronaux convolutifs profonds sont en train de révolutionner les techniques d’apprentissages classiques basées sur l’apprentissage supervisé, en particulier quand les données sont de très grande taille. Les réseaux neuronaux convolutifs profonds, introduits par Y. Le Cun en 1990, donnent actuellement les meilleurs résultats expérimentaux pour la classification d’image, la reconnaissance de la parole, des applications bio-médicales, la compréhension du langage naturel, etc…

Les réseaux neuronaux convolutifs profonds de Le Cun font partie des réseaux neuronaux multi-couches, qui propagent les données à travers une succession d’opérateurs linéaires et non linéaires. Dans le cas des réseaux convolutifs, les opérateurs linéaires sont des convolutions, suivies par une non-linéarité, dans au moins 5 couches. Les expériences montrent que plus le nombre de couches augmente, plus le réseau construit des invariants pertinents. Par contre, sur le plan mathématique, cette propriété des CNN reste encore non expliquée.


Sujet

Dans cet IRL on s’intéressera à une classe particulière de CNN, les opérateurs de “scattering”, introduits par S. Mallat en 2012 : ces opérateurs utilisent comme noyau de convolution des filtres d’ondelettes, et comme opérateur non linéaire le module. On construit ainsi pour les images des représentations invariantes, stables et caractéristiques : Ces opérateurs sont stables par déformation, ce qui les rend très intéressants pour l’analyse d’image en vision par ordinateur.

L’objectif de cet IRL est d’étudier dans un premier temps le point de vue mathématique des “ wavelet scattering networks” , afin de bien comprendre les différentes opérations qui constituent chaque couche du réseau, et leurs propriétés. Dans un deuxième temps, on appliquera cette transformation à la classification d’images : on pourra pour cela utiliser la boite à outil ScatNet (diffusée librement) , développée en Matlab.


Résultats attendus

Ce travail d'IRL sera pour une partie une étude bibliographique, à partir d’articles de S. Mallat et de Y. Le Cun. La méthode sera validée à partir d’une base d’images en utilisant une boite à outils Matlab.