Doneer aan arXiv
Titel:Deep Residual Learning for Image Recognition
Download PDF
Abstract: Diepere neurale netwerken zijn moeilijker te trainen. Wij presenteren een raamwerk voor residueel leren om de training te vergemakkelijken van netwerken die aanzienlijk dieper zijn dan die welke voorheen werden gebruikt. We herformuleren de lagen expliciet als het leren van residuele functies met verwijzing naar de laaginputs, in plaats van het leren van niet-gerefereerde functies. We leveren uitgebreide empirische bewijzen die aantonen dat deze residuele netwerken gemakkelijker te optimaliseren zijn, en dat ze aan nauwkeurigheid winnen door een aanzienlijk grotere diepte. Op de ImageNet dataset evalueren we restnetten met een diepte tot 152 lagen—8x dieper dan VGG netten maar nog steeds met een lagere complexiteit. Een ensemble van deze residuele netten behaalt een fout van 3,57% op de ImageNet testset. Dit resultaat behaalde de eerste plaats op deILSVRC 2015 classificatietaak. We presenteren ook analyses op CIFAR-10 met 100 en 1000 lagen.
De diepte van representaties is van centraal belang voor veel visuele herkenningstaken. Alleen dankzij onze extreem diepe representaties, verkrijgen we een relatieve verbetering van 28% op de COCO object detectie dataset. Diepe restnetten vormen de basis van onze inzendingen voor ILSVRC & COCO 2015-wedstrijden, waar we ook de 1e plaatsen wonnen op de taken ImageNet-detectie, ImageNet-lokalisatie, COCO-detectie, en COCO-segmentatie.