Donate to arXiv
Titel:Deep Residual Learning for Image Recognition
Ladda ner PDF
Sammanfattning: Djupare neurala nätverk är svårare att träna. Vi presenterar en ram för residualinlärning som underlättar utbildningen av nätverk som är betydligt djupare än de som tidigare använts. Vi omformulerar uttryckligen lagren som inlärning av restfunktioner med hänvisning till lagrens ingångar, i stället för inlärning av orefererade funktioner. Vi tillhandahåller omfattande empiriska bevis som visar att det är lättare att optimera dessa restnätverk och att de kan få högre noggrannhet med betydligt större djup. På ImageNet-dataset utvärderar vi residualnät med ett djup på upp till 152 lager – 8 gånger djupare än VGG-nät men ändå med lägre komplexitet. En ensemble av dessa kvarvarande nät uppnår ett fel på 3,57 % på ImageNet-testuppsättningen. Detta resultat vann första platsen i klassificeringsuppgiftenILSVRC 2015. Vi presenterar också en analys av CIFAR-10 med 100 och 1000 lager.
Djupet på representationerna är av central betydelse för många visuella igenkänningsuppgifter. Enbart tack vare våra extremt djupa representationer uppnår vi en relativ förbättring på 28 % i COCO-datasetet för objektsdetektering. Djupa residualnät är grunden för våra bidrag till ILSVRC & COCO 2015-tävlingarna, där vi också vann första plats på uppgifterna ImageNet-detektion, ImageNet-lokalisering, COCO-detektion och COCO-segmentering.