基于多尺度多分类器卷积神经网络的混合失真类型判定方法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:whsvlsy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对图像混合失真类型判定难的问题,在深度学习多标签分类思想的基础上,提出了一种基于多尺度多分类器卷积神经网络(CNN)的混合失真类型判定方法.首先,从图像中截取得到含有高频信息的图像块,将该图像块输入到不同感受野的卷积层中以提取图像的浅层特征图;其次,将浅层特征图输入到各子分类器结构中以进行深层次的特征提取和融合,将融合的特征通过Sigmoid分类器得到判定结果;最后,将各子分类器的判定结果进行融合得到图像的混合失真类型.实验结果表明,在自然场景混合失真数据库(NSMDID)上,所提方法对图像中存在的混合失真类型的平均判定准确率可以达到91.4%,且对大部分类型的判定准确率都在96.8%以上,可见所提方法能够对混合失真图像中的失真类型进行有效的判定.
其他文献
很多传统社区检测方法大多局限于单关系网络,适用性和准确性均较弱.针对此问题,提出了一种针对多关系网络的社区检测方法.首先,为进行多关系网络建模,使用了三阶邻接张量,其中张量的每个切片表示与参与者之间一种类型的关系相对应的邻接矩阵.从数据表示的角度,将多关系网络解读为三阶张量利于将因子分解方法作为学习方法使用.然后,应用RESCAL分解作为关系学习的工具,从而揭示参与者的唯一隐性表征.最后,在上一步得到的结果上应用进化K均值聚类算法,以确定多维度上的社区结构.在一个合成数据集和两个公开数据集上进行实验.实验
文本特征是自然语言处理中的关键部分.针对目前文本特征的高维性和稀疏性问题,提出了一种基于Word2Vec词嵌入和高维生物基因选择遗传算法(GARBO)的文本特征选择方法,从而便于后续文本分类任务.首先,优化数据输入形式,使用Word2Vec词嵌入方法将文本转变成类似基因表示的词向量;然后,将高维词向量模拟基因表达方式进行迭代进化;最后,使用随机森林分类器对特征选择后的文本进行分类.使用中文评论数据集对所提出的方法进行实验,实验结果表明了优化后的GARBO特征选择方法在文本特征选择上的有效性,该方法成功地将
针对当前主流神经网络在处理答案选择任务时无法同时满足句子的充分表示以及句子间信息充分交互的问题,提出了基于动态注意力和多角度匹配(DAMPM)的答案选择模型.首先,调用预训练语言模型的嵌入(ELMo)获得包含简单语义信息的词向量;接着,在注意力层采用过滤机制有效地去除句子中的噪声,从而更好地得到问句和答案句的句子表征;其次,在匹配层同时引入多种匹配策略来完成句子向量之间的信息交互;然后,利用双向长短期记忆(BiLSTM)网络对匹配层输出的句子向量进行拼接;最后,通过分类器来计算拼接向量的相似度大小,从而得
在交互式网络电视(IPTV)应用中,家庭电视终端往往由多名家庭成员共用,现有推荐算法难以从终端历史数据中分析出家庭成员的不同兴趣偏好.为了满足同一终端下不同成员的视频点播需求,提出了一种基于胶囊网络的IPTV视频点播推荐模型CapIPTV.首先,设计了一种基于胶囊网络路由机制的用户兴趣生成层,将终端历史行为数据作为输入,并通过胶囊网络的聚类特性得到不同家庭成员的兴趣表达;其次,利用注意力机制给不同的兴趣表达动态分配注意力权重;最后,提取出不同家庭成员的兴趣向量和点播视频的表示向量,计算两者内积后得出Top
基于会话的推荐旨在根据当前用户的匿名会话的点击序列信息来预测用户的下一次点击行为.现有方法多数都是通过对用户会话点击序列的物品信息进行建模,并学习物品的向量表示,进而进行推荐.而作为一种粗粒度的信息,物品的类别信息对物品有聚合作用,可作为物品信息的重要补充.基于此,提出了基于会话的多粒度图神经网络推荐模型(SRMGNN).首先,使用图神经网络(GNN)得到会话序列中的物品和物品类别的嵌入向量表示,并使用注意力网络捕捉用户的注意力信息;然后,将赋予了不同注意力权重值的物品和物品类别信息进行融合后,输入到门限
针对工业机器人机械轴健康管理中检测效率和精准度较低的问题,提出了一种机械轴运行监控大数据背景下的基于动作周期退化相似性度量的健康指标(HI)构建方法,并结合长短时记忆(LSTM)网络进行机器人剩余寿命(RUL)的自动预测.首先,利用MPdist关注机械轴不同动作周期之间子周期序列相似性的特点,并计算正常周期数据与退化周期数据之间的偏离程度,进而构建HI;然后,利用HI集训练LSTM网络模型并建立HI与RUL之间的映射关系;最后,通过MPdist-LSTM混合模型自动计算RUL并适时预警.使用某公司六轴工业
在印刷工业生产中,针对直接使用YOLOv4网络进行印刷缺陷目标检测精度低、所需训练样本数量大的问题,提出了一种基于Siamese-YOLOv4的印刷品缺陷目标检测方法.首先,使用了一种图像分割和随机参数变化的策略对数据集进行增强;然后,在主干网络中增加了孪生相似性检测网络,并在相似性检测网络中引入Mish激活函数来计算出图像块的相似度,在此之后将相似度低于阈值的区域作为缺陷候选区域;最后,训练候选区域图像,从而实现缺陷目标的精确定位与分类.实验结果表明:Siamese-YOLOv4模型的检测精度优于主流的
针对深度卷积生成对抗网络(DCGAN)中的对抗训练缺乏灵活性以及DCGAN所使用的二分类交叉熵损失(BCE loss)函数存在优化不灵活、收敛状态不明确的问题,提出了一种基于仲裁机制的生成对抗网络(GAN)改进算法,即在DCGAN的基础上引入了所提出的仲裁机制.首先,所提改进算法的网络结构由生成器、鉴别器和仲裁器组成;然后,生成器与鉴别器会根据训练规划进行对抗训练,并根据从数据集中感知学习到的特征分别强化生成图像以及辨别图像真伪的能力;其次,由上一轮经过对抗训练的生成器和鉴别器与度量分数计算模块一起组成仲
针对传统的表面缺陷检测方法只能对具有高对比度或低噪声的明显缺陷轮廓进行检测的问题,提出了一种基于自编码和知识蒸馏的表面缺陷检测方法来准确定位和分类从实际工业环境捕获的输入图像中出现的缺陷.首先,设计了一种级联自动编码器(CAE)架构用于分割和定位缺陷,其目的是将输入的原始图像转换为基于CAE的预测蒙版;其次,利用阈值模块对预测结果进行二值化以获得准确的缺陷轮廓;然后,把缺陷区域检测器提取并裁剪出来的缺陷区域视为下一个模块的输入;最后,将CAE分割结果的缺陷区域通过知识蒸馏进行类别分类.实验结果表明,与其他
针对古代壁画图像数量少、质量差、特征提取困难和存在壁画文本与绘画风格相似等问题,提出了一种融合迁移学习的Inception-v3模型来对古代壁画的朝代进行识别与分类.首先,将Inception-v3模型在ImageNet数据集上进行预训练以得到迁移模型;然后,将迁移模型在小型壁画数据集上进行参数微调后对壁画图像提取高层特征;其次,增加两个全连接层来增强特征表达能力,并用颜色直方图与局部二值模式(LBP)纹理直方图提取壁画的艺术特征;最后,将高层特征与艺术特征相融合,用Softmax分类器进行壁画的朝代分类