Donner à arXiv

Avr 30, 2021
admin

Titre:Apprentissage résiduel profond pour la reconnaissance d’images

Auteurs:Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun

Télécharger le PDF

Résumé : Les réseaux neuronaux plus profonds sont plus difficiles à entraîner. Nous présentons un cadre d’apprentissage résiduel pour faciliter la formation de réseaux qui sont sensiblement plus profonds que ceux utilisés précédemment. Nous reformulons explicitement les couches comme apprenant des fonctions résiduelles en référence aux entrées des couches, au lieu d’apprendre des fonctions non référencées. Nous fournissons des preuves empiriques complètes montrant que ces réseaux résiduels sont plus faciles à optimiser et peuvent gagner en précision avec une profondeur considérablement accrue. Sur le jeu de données ImageNet, nous évaluons des réseaux résiduels avec une profondeur allant jusqu’à 152 couches – 8 fois plus profonds que les réseaux VGG mais toujours moins complexes. Un ensemble de ces réseaux résiduels atteint une erreur de 3,57 % sur l’ensemble de test ImageNet. Ce résultat a remporté la première place de la tâche de classificationILSVRC 2015. Nous présentons également une analyse sur CIFAR-10 avec 100 et 1000 couches.
La profondeur des représentations est d’une importance centrale pour de nombreuses tâches de reconnaissance visuelle. Uniquement grâce à nos représentations extrêmement profondes, nous obtenons une amélioration relative de 28% sur le jeu de données de détection d’objets COCO. Les réseaux résiduels profonds sont les fondements de nos soumissions aux compétitions ILSVRC & COCO 2015,où nous avons également remporté les 1ères places sur les tâches de détection ImageNet, de localisation ImageNet, de détection COCO et de segmentation COCO.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.