Donate to arXiv

Apr 30, 2021
admin

Title:Deep Residual Learning for Image Recognition

Authors:Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun

Download PDF

Abstract: Tiefere neuronale Netzwerke sind schwieriger zu trainieren. Wir stellen ein Residuallearning-Rahmenwerk vor, um die Ausbildung von Netzen zu erleichtern, die wesentlich tiefer sind als die bisher verwendeten. Wir formulieren die Schichten explizit als lernende Residualfunktionen mit Bezug auf die Schichteingänge um, anstatt nicht referenzierte Funktionen zu lernen. Wir liefern umfassende empirische Belege dafür, dass diese Residualnetze einfacher zu optimieren sind und durch eine erheblich größere Tiefe an Genauigkeit gewinnen können. Auf dem ImageNet-Datensatz evaluieren wir Residualnetze mit einer Tiefe von bis zu 152 Schichten – achtmal tiefer als VGG-Netze, aber immer noch mit geringerer Komplexität. Ein Ensemble dieser Residualnetze erreicht einen Fehler von 3,57 % auf dem ImageNet-Testsatz. Dieses Ergebnis gewann den 1. Platz bei derILSVRC 2015 Klassifizierungsaufgabe. Wir präsentieren auch Analysen zu CIFAR-10 mit 100 und 1000 Schichten.
Die Tiefe der Repräsentationen ist von zentraler Bedeutung für viele visuelle Erkennungsaufgaben. Allein aufgrund unserer extrem tiefen Repräsentationen erzielen wir eine relative Verbesserung von 28 % im COCO-Objekterkennungsdatensatz. Tiefe Residualnetze sind die Grundlage unserer Einreichungen bei den ILSVRC & COCO-Wettbewerben 2015, bei denen wir auch die ersten Plätze für die Aufgaben ImageNet-Erkennung, ImageNet-Lokalisierung, COCO-Erkennung und COCO-Segmentierung gewonnen haben.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.