Donate to arXiv
Název:Deep Residual Learning for Image Recognition
Stáhnout PDF
Abstrakt: Hlubší neuronové sítě je obtížnější trénovat. Představujeme rámec reziduálního učení, který usnadňuje trénování sítí, které jsou podstatně hlubší než dříve používané sítě. Vrstvy explicitně přeformulujeme jako učící se reziduální funkce s odkazem na vstupy vrstev namísto učících se nereferenčních funkcí. Poskytujeme komplexní empirické důkazy, které ukazují, že tyto reziduální sítě se snadněji optimalizují a mohou získat přesnost díky výrazně větší hloubce. Na datové sadě ImageNet hodnotíme zbytkové sítě s hloubkou až 152 vrstev – 8x hlubší než sítě VGG, ale stále s nižší složitostí. Soubor těchto zbytkových sítí dosahuje na testovací sadě ImageNet chyby 3,57 %. Tento výsledek získal 1. místo v klasifikační úlozeILSVRC 2015. Uvádíme také analýzu na CIFAR-10 se 100a 1000 vrstvami.
Hloubka reprezentace má zásadní význam pro mnoho úloh vizuálního rozpoznávání. Pouze díky našim extrémně hlubokým reprezentacím jsme dosáhli 28% relativního zlepšení na datové sadě pro detekci objektů COCO. Hluboké zbytkové sítě jsou základem našich příspěvků do soutěže ILSVRC & COCO 2015,kde jsme také získali 1. místa v úlohách detekce ImageNet, lokalizace ImageNet, detekce COCO a segmentace COCO.