论文部分内容阅读
循环聚焦模型(recurrent attention model,RAM)与卷积神经网络相比,具有参数少、计算量独立于输入、高噪声下较高正确率等优点。RAM可以有效识别数字或真实图像中的数字,比如谷歌街牌,不能有效识别自然场景图像,比如用于普适物体识别常用数据集Cifar10等。针对以上不足,提出一种基于卷积的改进模型,通过在聚焦模型中添加卷积层,使其可以有效识别自然场景图像,改进后的RAM在Cifar10的正确率达到95.3%。