Donate to arXiv

kw. 30, 2021
admin

Title:Deep Residual Learning for Image Recognition

Authors:Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun

Download PDF

Abstract: Deeper neural networks are more difficult to train. Przedstawiamy ramy uczenia rezydualnego, aby ułatwić trening sieci, które są znacznie głębsze niż te używane wcześniej. W sposób jawny przeformułowujemy warstwy jako uczące się funkcji resztowych w odniesieniu do wejść warstw, zamiast uczenia się funkcji niereferencyjnych. Dostarczamy wyczerpujących dowodów empirycznych pokazujących, że takie sieci resztowe są łatwiejsze do zoptymalizowania i mogą uzyskać dokładność dzięki znacznie większej głębokości. Na zbiorze danych ImageNet oceniamy sieci szczątkowe o głębokości do 152 warstw – 8x głębsze niż sieci VGG, ale wciąż o niższej złożoności. Zespół tych siatek resztkowych osiąga 3,57% błędu na zbiorze testowym ImageNet. Wynik ten zajął 1 miejsce w zadaniu klasyfikacyjnymILSVRC 2015. Przedstawiamy również analizę na CIFAR-10 z 100 i 1000 warstwami.
Głębokość reprezentacji ma kluczowe znaczenie dla wielu zadań rozpoznawania wizualnego. Wyłącznie dzięki naszym niezwykle głębokim reprezentacjom, uzyskujemy 28% względną poprawę na zbiorze danych detekcji obiektów COCO. Głębokie sieci rezydualne są podstawą naszych zgłoszeń do konkursu ILSVRC & COCO 2015, gdzie również zdobyliśmy 1. miejsca w zadaniach ImageNet detection, ImageNetlocalization, COCO detection i COCO segmentation.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.