基于多特征的主动学习方法在图像分类中的应用研究

来源 :河北工程大学 | 被引量 : 4次 | 上传用户:laowu000001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机、网络、通信技术的飞速发展,各种形式的数字图像呈爆炸式增长。图像分类技术在对这些海量数据进行高效分类及管理上具有重要研究意义。在图像分类中,需要大量的标注样本,而标注样本需要消耗大量的人力、物力。为此,以降低标注成本为目的主动学习方法在图像分类研究中受到了广泛的关注。主动学习方法的基本思想是选取信息量较大的样本来训练分类模型,以实现利用较少的标注样本达到预期分类精度的目的。然而,在主动学习过程中数据往往基于单一特征,选取的待标注样本信息量比较有限。为了进一步提高标注样本信息量,本文对基于多特征的主动学习方法进行研究,并将其用于图像分类。在基于多特征的主动学习方法实现过程中,本文主要研究了多特征选取方法以及主动学习方法中的采样策略。在多特征选取方法的研究中,首先将多个基于不同特征的SVM进行集成来解决基于多特征分类模型的构建问题。然后对多特征选取方法进行分析,提出了一种改进的EPD多特征选取方法。在以往的采样策略都是基于样本单个特征,不适合直接用于基于多特征的主动学方法中。为了实现基于多特征的样本采样,本文提出了一种改进的边缘采样方法。该方法在多个SVM模型上对未标记样本进行预测,根据预测结果和样本到超平面的距离选取不确定性样本,在本文中将其称为“基于多SVM的边缘采样”。使用Corel和NUS-WIDE-CATEGORY数据集中的样本对提出的方法进行验证,并与其它方法进行对比分析。在训练样本数量相同的条件下,本文研究的方法有效地提高了分类精度;此外,在达到最佳分类效果时,也降低了样本标注比例,实现利用较少的标注样本达到预期分类精度的研究目的。
其他文献
随着互联网技术的成熟,各类依托于网络的电子平台得到很好的发展和普及,人们可以通过这样的网络媒体表达自己的观点和意见,其中蕴藏着大量信息,具有不可小觑的研究价值。产品
VoIP(Voice over IP)技术包含SIP、H.323等一系列的协议,它以强大的功能、低廉的价格以及高度的灵活性对传统传统通信提出了强大的挑战。VoIP不但支持语音的传输,而且能够提
随着手持移动设备的在日常生活中的日益普及,利用其获取Web网页信息的应用模式迅速发展。目前互联网绝大多数网页是针对桌面计算机的显示屏幕分辨率设计的。手持移动设备的屏
网络技术的不断发展,需要利用数据挖掘技术从大量的网络信息中挖掘出对人们有用的资源。目前比较成熟的信息推荐技术是采用面向网络信息来解决以上问题的。但是,这种方式很难
随着计算机网络技术的飞速发展,信息安全越来越受到人们的重视。如何保证网络上数据的保密性、可信性、完整性、不可抵赖性已经成为网络安全领域的主要课题。公钥基础设施(PKI
P2P(Peer-to-Peer)技术的大量应用对目前的网络应用提出了巨大挑战,它的Peer端平等性,正在带来因特网的革命,而基于P2P网络的搜索效率研究是推动P2P网络进一步发展的关键问题
Web应用程序因其易于部署维护和成本低的特点,近年来在电子商务、电子政务等领域应用广泛。Web应用程序迅速发展,从只有静态内容发展到拥有众多动态内容,成为企业、政府发布信息
小波分析(Wavelet Analysis)是当前应用数学和工程学科中一个迅速发展的新领域,与傅立叶分析(FourierAnalysis)相比,小波分析是空间(时间)和频率的局部分析,因而能有效地从信
本课题来源于综合电子设备仿真测试与故障注入系统的子课题,开发了基于VxWorks平台的1553B总线测试系统。论文着重阐述对虚拟设备、物理I/O模块、模块间通信协议的研究,详细
在政府向“柔性家长制”转换以及企业向“弱利他主义”转变的趋势下,政府和企业在数据管理与服务方面正面临着很多挑战。首先,政府、企业部门需要建立一个统一的数据视图,以便决