Donate to arXiv
Title:Deep Residual Learning for Image Recognition
Download PDF
Abstract: Dybere neurale netværk er vanskeligere at træne. Vi præsenterer en residuallearning-ramme til at lette træningen af netværk, der er væsentligt dybere end dem, der tidligere er blevet anvendt. Vi omformulerer udtrykkeligt lagene som indlæring af residualfunktioner med reference til lagindgangene i stedet for indlæring af urefererede funktioner. Vi fremlægger omfattende empiriske beviser, der viser, at disse restnetværk er lettere at optimere og kan opnå større nøjagtighed ved at øge dybden betragteligt. På ImageNet-datasættet evaluerer vi residualnet med en dybde på op til 152 lag – 8 gange dybere end VGG-nettene, men stadig med en lavere kompleksitet. Et ensemble af disse restnet opnår en fejl på 3,57 % på ImageNet-testsættet. Dette resultat vandt førstepladsen iILSVRC 2015-klassifikationsopgaven. Vi præsenterer også en analyse af CIFAR-10 med 100 og 1000 lag.
Dybden af repræsentationer er af central betydning for mange visuelle genkendelsesopgaver. Alene på grund af vores ekstremt dybe repræsentationer opnår vi en relativ forbedring på 28 % på COCO-datasættet for objektdetektion. Dybe residualnet er grundlaget for vores indsendelser til ILSVRC & COCO 2015-konkurrencerne, hvor vi også vandt førstepladserne på opgaverne ImageNet-detektion, ImageNet-lokalisering, COCO-detektion og COCO-segmentering.