Donate to arXiv
Titlu: Învățare reziduală profundă pentru recunoașterea imaginilor
Download PDF
Rezumat: Rețelele neuronale mai profunde sunt mai dificil de antrenat. Prezentăm un cadru de învățare reziduală pentru a ușura antrenarea rețelelor care sunt substanțial mai profunde decât cele utilizate anterior. Reformulăm în mod explicit straturile ca fiind funcții reziduale de învățare cu referire la intrările straturilor, în loc de a învăța funcții fără referință. Furnizăm dovezi empirice cuprinzătoare care arată că aceste rețele reziduale sunt mai ușor de optimizat și că pot obține o acuratețe cu o adâncime considerabil mai mare. Pe setul de date ImageNet, evaluăm rețele reziduale cu o adâncime de până la 152 de straturi – de 8 ori mai adânci decât rețelele VGG, dar având totuși o complexitate mai mică. Un ansamblu al acestor rețele reziduale atinge o eroare de 3,57% pe setul de testare ImageNet. Acest rezultat a câștigat locul 1 în cadrul sarcinii de clasificareILSVRC 2015. De asemenea, prezentăm analize pe CIFAR-10 cu 100și 1000 de straturi.
Profunditatea reprezentărilor este de o importanță centrală pentru multe sarcini de recunoaștere vizuală. Numai datorită reprezentărilor noastre extrem de profunde, obținem o îmbunătățire relativă de 28% pe setul de date de detectare a obiectelor COCO. Rețelele reziduale profunde sunt fundamentele prezentărilor noastre la concursurile ILSVRC & COCO 2015,unde am câștigat, de asemenea, locurile 1 la sarcinile de detecție ImageNet, localizare ImageNet, detecție COCO și segmentare COCO.