基于Mask R-CNN的瑜伽动作识别

来源 :山西大学 | 被引量 : 0次 | 上传用户:wtuye262626
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
使用计算机视觉进行目标检测和识别是过去三十年来非常有趣且充满挑战的研究领域。在过去的十几年中,计算能力的迅速提高使得深度学习取得了突破性的进展,重新激发了研究人员对该领域的兴趣。基于机器学习和计算机视觉技术的分类和目标定位一直是研究的热门,并且取得了很大的成就。职业运动员对体能锻炼和体育技术的追求从未停止探索,各个年龄阶段的人对体育运动都愈发重视。专业运动员可以通过自动或半自动系统来辅助训练,提高训练成效,热爱运动的普通人则可以通过合适的系统进行自学以及纠正训练。这样的需求促使了研究人员将人工智能与运动领域相结合来进行研究。本文则主要针对健身运动领域中的瑜伽运动识别进行研究。根据目标检测的任务要求,分析常见的特征提取与识别分类的经典卷积神经网络。考虑到网络深度加深容易导致梯度消失问题,本文使用深度残差网络作为主干网络进行识别检测。深度残差网络由多个残差块级联而成,改进残差网络是在经典残差单元的基础上加入批归一化层,提高网络学习能力与性能。并使用人脸关键点检测数据集进行后的深度残差网络的验证。基于瑜伽动作识别的图像任务,提出了一种基于Mask R-CNN的瑜伽动作识别方法。改进的Mask R-CNN模型是基于区域卷积网络的框架与结构,通过特征提取对图像提出一定数量的候选区域并对其进行分类,然后将这些区域作为检测到的边界框输出,并对候选区域使用分割分支做掩膜预测。改进的Mask R-CNN模型使用改进深度残差网络作为特征提取主干网络,使用ROIAlign对提取到的候选区域进行双线性插值,之后进行目标分类与检测,并利用分割分支对图像分割。模型改进了分割分支中的卷积部分,用深度可分离卷积替换原来的标准卷积,提高网络效率。实验构建多边形标注的数据集,利用算法进行仿真。网络的加深以及深度可分离网络的使用在保持网络可靠性的基础上,提高了检测的准确度,验证了改进Mask R-CNN网络的有效性。
其他文献
<正>China joined the WTO to become its 143rd member state on November 10, 2001 after eight years of negotiations. A seminar titled the Future of China and WTO w
袋栽白背毛木耳菌种优质生产技术郭翠英(福建省亚热带植物研究所厦门361006)白背毛木耳干耳黑面白背,朵大肉厚,销路好,价格高,适合国际市场需要,发展势头好,近几年在福建闽南地区利用塑料荫
目的探讨促肾上腺皮质激素在绝经后骨质疏松症发病机制中的作用。方法40其SD雌性大鼠分为去势组和对照组,分别于术后第6周末和第12周末处死,行血、尿生化检查,取大鼠垂体行ACTH
语文所占课时之多是有目共睹的,可学生从小学到中学为什么不能十年磨一剑呢?究竟是什么在长期困扰着我们的语文教学?我觉得,造成小学语文教学效率低的原因很多,但其中一个根本原因
1989年,伍启伦博士创业伊始。时至今日,他已成功勾勒出一个世界级的商业版图。在过去23年的投资经历中,伍启伦博士一直以促进国内外经济和文化交流为己任,以树立华企和华商的良好
本法栽培竹荪,采用大筐简易制生产种,不需常规灭菌和接种时的无菌操作;采用纯竹屑培养料,不加米糠、麦麸等辅料;防虫不用化学农药而用价廉无毒的茶桔粉。是一种省工、省时、省成本
脉冲耦合神经网络(PCNN)是20世纪90年代形成和发展的一种新型神经网络。为了自动地进行精确的图像分割,在基于图像处理的前提下,对现有的PCNN模型进行了改进,即从原始图像与分割图像的目标之间、背景之间的差异性出发,提出了一种基于最小交叉熵准则的改进型PCNN图像分割新方法。通过计算机仿真,该方法能够自动确定循环迭代次数和自动选取最佳阈值,并与基于最大香农熵的PCNN分割方法进行了比较。实验结果
进入新世纪以来,随着电脑、移动设备、互联网和移动互联网技术的普及与提升,游戏行业获得飞速成长的土壤。国内市场经历了从无到有、从有到优、从客户端到移动端、从国外进口到出口国外的颠覆式历程,市场规模从2009年的263亿元发展到2018年的2144亿元,十年间增长超7倍,网游产品的市场存量更是达到数万款。伴随着行业的高速成长,对应的资本活动也日益活跃,比如股权风险投资、IPO、并购、出售、借壳上市等。
香菇菌种抗病性对生料栽培影响的探讨黑龙江省牡丹江林校孙永琴李宏伟香菇菌种的抗病性是指香菇菌种对各种霉菌侵染的抵抗,保持正常生长发育的能力。香菇菌种的这种能力除取决