基于图的半监督学习算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:fgjfg111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
半监督学习是当前机器学习研究中最受关注的问题之一。半监督学习只利用少量的标记数据和大量未标记数据进行学习。在减少人工标注代价和提高学习器性能方面,半监督学习具有较突出的优势,其研究成果已逐渐用于解决实际问题。图方法是半监督学习中研究比较多的一种方法,其理论基础比较健全。图方法可以很好的刻画数据自身的结构特征,而不需带有某种分布的偏向,该方法直观、灵活,但是其计算量很大,成为实际应用中的屏障。对基于图的半监督学习方法进行了系统的分析研究,特别针对局部和全局一致性学习方法(Learning from Local and Global Consistency,LLGC)中计算量大的问题进行了深入分析,提出了基于quick shift的图构建方法。首先,按照quick shift方法对原始数据进行局部范围的聚类;然后,在聚类后的簇上构造一个新的无向连通图;最后,在新图上利用LLGC方法进行分类。由于quick shift方法以非参数密度估计理论为基础,具有保持原始数据分布状况的良好属性,因此,对数据进行聚类,并不会降低图方法的准确性。另一方面,聚类后簇的数目较样本点的数目少很多,即新图的节点数目远远少于原始图的节点数目,从而大大提升了LLGC分类的运算速度。对茶壶图像、手写数字和英文字符3类实用数据分别进行了实验,结果表明,改进后的方法不仅在分类准确度方面与LLGC方法相当,而且在计算速度方面,要明显优于LLGC方法。
其他文献
系统复杂性继续按照摩尔定律增加,而功能复杂性的增加速度则更加迅猛。为解决复杂性增加的问题,EDA行业提出了通过自动化来实现设计抽象(Design Abstraction)的概念。由于设
网络已经发展成为人们生活的重要部分,网络上存储的信息是海量的,而且处于不断变化中。网络用户期望得到个性化的服务,网络服务端需要为其推出个性化服务提供决策参考,用户兴
近年来,随着Internet/Web 技术的快速普及和迅猛发展,它为人们提供了丰富的信息资源的同时,其所具有的海量数据、复杂性、极强的动态性和用户的多态性等特点也给Web 资源的发
随着实时系统在各领域的广泛应用,任务调度技术在实时系统中扮演的角色越来越重要。针对实时系统的多任务、多处理器和复杂优先约束性等特点,需要对实时任务的可调度性分析方
近年来,随着互联网的持续飞速发展,网络规模在扩大,复杂性在增长,各种新兴服务和应用不断涌现,网络测量的要求越来越高。对一个规模空前庞大的网络进行网络性能的监控与管理,
空间数据库和基于移动用户位置的信息服务正得到日益广泛的应用,对访问控制模型也具有特殊要求:用户地理位置的变化通常会引起用户权限的变化。因此,空间信息在访问控制模型
随着政府信息化建设的不断深入和信息通信技术的飞速发展,数据汇总系统也得到越来越广泛的应用。及时、完整、准确地进行数据汇总,对上级部门提高管理水平和决策效率,加强对
产品协同设计是现代设计技术的应用模式之一,它是由两个及两个以上的设计主体,在分布计算机网络环境下,相互协作,互相完成一个产品的设计过程。产品的协同设计具有异地网络环
随着计算机技术的发展和网络技术的不断进步,网络教学得到了越来越多的应用。学习者可以足不出户的在网上进行学习、考试、讨论、答疑等。由于这种教育方式突破了时空的限制,
目前,全球信息化浪潮发展迅猛,我国也正加速向信息化社会迈进。及时应对IP地址耗尽问题,积极推进向下一代互联网的顺利过渡,是历史赋予我们的战略发展机遇。教育部“教育科研