Il s’agit d’un type de réseau de neurones, dont le motif de connexion entre neurones est inspiré par le cortex visuel des animaux, très utilisée pour la reconnaissance d’images. On prend une matrice de pixels en entrée, pour chaque pixel on prend les pixels adjacents et on les compare à une “kernel” pour appliquer un filtre qui auront pour chacun un but (détecter les bords par exemple), la somme des multiplications donne la nouvelle valeur du pixel central, exemple ici.

Pour reconnaître une image on va appliquer cette opération avec des matrices de plus en plus petites, on va donc avoir des régions d’images de plus en plus petites sur lesquelles on va appliquer nos opérations mais on va les empiler, on se retrouvera au final avec un vecteurs de pixels qui seront passés dans les entrées d’un réseau neuronal (1 pixel = 1 input)

Il est possible de faire de la 1D-CNN qui consiste à partir d’un format de dimension 1D afin d’avoir un output en 2D, le principe y ressemble globalement, à la seule différence que au lieu de prendre une matrice à chaque passage on prend un vecteur de taille fixe: