Donate to arXiv
Title:Deep Residual Learning for Image Recognition
Download PDF
Abstract: Las redes neuronales más profundas son más difíciles de entrenar. Presentamos un marco de aprendizaje residual para facilitar el entrenamiento de redes que son sustancialmente más profundas que las utilizadas anteriormente. Reformulamos explícitamente las capas como aprendizaje de funciones residuales con referencia a las entradas de las capas, en lugar de aprender funciones no referenciadas. Proporcionamos pruebas empíricas exhaustivas que demuestran que estas redes residuales son más fáciles de optimizar y pueden ganar en precisión con una profundidad considerablemente mayor. En el conjunto de datos ImageNet, evaluamos redes residuales con una profundidad de hasta 152 capas, 8 veces más profundas que las redes VGG, pero con una complejidad menor. Un conjunto de estas redes residuales consigue un error del 3,57% en el conjunto de pruebas de ImageNet. Este resultado ganó el primer puesto en la tarea de clasificación delILSVRC 2015. También presentamos un análisis en CIFAR-10 con 100 y 1000 capas.
La profundidad de las representaciones es de vital importancia para muchas tareas de reconocimiento visual. Sólo gracias a nuestras representaciones extremadamente profundas, obtenemos una mejora relativa del 28% en el conjunto de datos de detección de objetos COCO. Las redes residuales profundas son la base de nuestras presentaciones en las competiciones de ILSVRC & COCO 2015, donde también ganamos los primeros puestos en las tareas de detección de ImageNet, localización de ImageNet, detección de COCO y segmentación de COCO.