论文地址:https://arxiv.org/abs/1512.03385v1
更深层的神经网络更难以训练。我们提出了一个残差学习框架,以便于训练比以往使用的网络更深层的网络。我们明确地将层重构为学习相对于层输入的残差函数,而不是学习无参考的函数。我们提供了全面的实证证据,表明这些残差网络更容易优化,并且可以从显著增加的深度中获得准确度的提高。在ImageNet数据集上,我们评估了深度高达152层的残差网络——比VGG网络[41]深8倍,但复杂度仍然较低。这些残差网络的集成在ImageNet测试集上达到了3.57%的错误率。这个结果赢得了2015年ILSVRC分类任务的第一名。我们还对CIFAR-10数据集进行了100层和1000层的分析。
对于许多视觉识别任务来说,表示的深度至关重要。仅仅由于我们极其深入的表示,我们在COCO物体检测数据集上获得了28%的相对改进。深度残差网络是我们提交到2015年ILSVRC和COCO竞赛的基础1,我们还在ImageNet检测、ImageNet定位、COCO检测和COCO分割任务上获得了第一名。