Comprendre linfluence de la taille des couches cachées dans la capacité de généralisation des modèles de réseaux de neurones est une question qui a suscité de très nombreux travaux. Dans cette série dexposés, nous proposons de présenter quelques modèles mathématiques pour répondre à cette problématique qui se basent soit sur la théorie des matrices aléatoires et des probabilités libres, soit sur la théorie des flots de gradient dans lespace de Wasserstein et les outils du transport optimal de mesures. Nous espérons ainsi débuter un groupe de travail autour de ces modèles dont de nombreux aspects peuvent intéresser la communauté de recherche en mathématiques appliquées à Bordeaux.