基于SVM的图像分类与标注方法的研究

被引量 : 21次 | 上传用户:wangyingygp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术的迅速发展,图像数据呈爆炸式增长,如何快速有效地获取和管理这些图像信息,已经成为了目前科学领域及工业生产领域的研究热点。图像的分类和标注作为处理海量图像数据的关键技术,能够在很大程度上解决图像数据自身的这种无序化问题,有着巨大的研究和应用价值。图像标注又可以被看作是一种分类问题,因此,本文主要研究基于分类方法实现的图像标注。而在目前的分类方法中,支持向量机(Support Vector Machine, SVM)在解决小样本、非线性以及高维的机器学习问题中展现出很多独特的优势,被广泛应用在图像分类领域。因此,本文重点研究基于SVM分类器的图像标注,并围绕着图像的单标签标注和多标签标注两个方面进行了研究。主要研究内容如下:在基于SVM分类器的单标签标注方面,本文提出了一种基于泛化的直方图相交核函数的多特征结合的图像分类算法。首先,针对单一特征只能片面地描述图像的部分属性,缺少足够的区分信息,图像分类准确率不高的问题,本文提出了多种特征相结合的思想。其次,本文对SVM分类器中的核函数进行了研究和优化,提出了一种新的核函数:泛化的直方图相交核函数。最后,本文采用提出的算法对图像进行分类,实验结果表明本文算法的平均分类准确率高于其他方法。在基于SVM分类器的多标签标注方面,本文深入地研究了多示例多标签问题,并提出了一种基于人眼感知度的示例生成方法。该方法在构造多示例的过程中,首先对图像进行分块,然后计算各个分块的人眼感知度权值,并使用权值来区分其对人眼视觉感知的重要程度。最后将生成的多示例与MIML-SVM(Multi-Instance Multi-label SVM)算法相结合,用以解决复杂的自然场景图像的多标签分类问题。实验结果表明,本文方法的各项分类性能指标均得到了改善,从而证明了基于人眼感知度的示例生成方法的有效性。
其他文献
产褥期抑郁症是指产后6周内第一次发病(既往无精神障碍史),以抑郁、悲伤、沮丧、哭泣、易激动、烦躁等一系列症状为特征的精神疾患(精神紊乱),重者出现幻觉、自杀或杀害婴儿[
目的:通过研究佳木斯地区儿童患者干眼与屈光不正相关性,探讨屈光不正在儿童干眼发生过程中的作用。方法:对在我院眼科门诊就诊主诉眨眼或眼干涩的患儿进行眼部常规检查和干眼
云计算在很大程度上改变了企业的运营模式和发展趋势,但随着云计算的不断发展和推广,云计算所面临的信息风险也日趋复杂和多样化,本文探讨了当前云计算在通信层面、架构层面
从桂花籽中提取了原花青素,并对提取纯化工艺进行了优化,对原花青素的抗氧化性进行了分析。研究发现,原花青素的最佳提取条件为:以60%乙醇作为提取剂、料液比为1∶8(g/mL)、
本文在思想政治教育视域下,重点论述了城乡大学生不同的思想状态、经济条件、素质结构、就业状况四个热点问题,对城乡大学生产生差异的主要特征、原因进行了分析、并在对策上也
工业生产和环境监测等领域对于高精度、高灵敏度的甲烷气体检测系统的需求都是十分迫切的。而可调谐激光二极管吸收光谱技术对于相较于传统气体检测技术,具有高选择性、高灵敏
英语阅读能力是人们获取各方面信息不可或缺的一种工具,其重要性不言而喻。且多年以来,我国各省高考英语试题也把阅读理解能力作为考查的重中之重。因此,广大英语教师非常注重阅
合同订立以后,当事人必须严守。这是古典契约理论“契约神圣”原则的必然要求。然而,当出现不可抗力、一方当事人根本违约等致使合同目的不能实现时,法律创设合同解除制度使得合
<正>中国青少年研究中心、日本青少年研究所、韩国青少年开发院及美国艾迪资源系统公司联合发布了一项针对四国高中生学习意识进行的比较研究成果。此次中国地区的调查对象是
智能城市公交调度系统是城市公交运输企业的核心业务系统之一,包含运营车辆实时信息采集、传输和处理等过程。系统的主要功能是根据运行计划和运输实际情况实时对运营车辆进行