Donate to arXiv
Título:Aprendizagem Residual Profunda para o Reconhecimento de Imagens
Download PDF
Resumo: As redes neurais mais profundas são mais difíceis de treinar. Apresentamos um quadro de aprendizagem residual para facilitar o treinamento de redes que são substancialmente mais profundas do que as utilizadas anteriormente. Reformulamos explicitamente as camadas como funções residuais de aprendizagem com referência às entradas das camadas, em vez de aprender funções não referenciadas. Fornecemos evidências empíricas abrangentes mostrando que estas redes residuais são mais fáceis de otimizar e podem ganhar em precisão a partir de uma profundidade consideravelmente maior. No conjunto de dados da ImageNet, avaliamos redes de profundidade até 152 camadas – 8x mais profundas do que as redes VGG, mas ainda com menor complexidade. Um conjunto destas redes residuais atinge 3,57% de erro no conjunto de teste ImageNet. Este resultado ganhou o 1º lugar na tarefa de classificação doILSVRC 2015. Também apresentamos análises no CIFAR-10 com 100 e 1000 camadas.
A profundidade das representações é de importância central para muitas tarefas de reconhecimento visual. Apenas devido às nossas representações extremamente profundas, obtemos uma melhoria relativa de 28% no conjunto de dados de detecção de objectos COCO. As redes residuais profundas são as bases das nossas submissões aos concursos ILSVRC & COCO 2015, onde também ganhamos os primeiros lugares nas tarefas de detecção de ImageNet, ImageNetlocalization, detecção de COCO, e segmentação de COCO.