论文部分内容阅读
行为识别是计算机视觉领域的一个重要研究课题,具有广泛的应用前景。针对现实中对视频整体序列结构建模会增加大量的冗余信息,提出了一种基于时空关注度长短期记忆网络(Spatial-Temporal Attention Long-Short Term Memory,STALSTM)的行为识别框架,提高了行为识别效率。利用GoogLeNet逐层卷积视频帧,自动聚合蕴含边、角和线等底层特征以生成具有显著结构性的高层语义特征。在LSTM中引入关注度网络来学习关注度权重,利用光流掩膜分割有效的运动前景区域,从而优化