多标记学习算法及其在标签推荐中应用研究

被引量 : 3次 | 上传用户:ccf107893228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的飞速发展带来了信息过载问题,它使用户很难从海量的数据中获取有用的信息.自动分类作为解决信息过载问题的有效手段,已经在众多领域得到广泛应用.传统的分类都假设实例只与一个标记相关,而在类似文本、图像、视频等领域中,实例通常都与多个标记相关,传统的分类算法也就不再适用,因此对多标记数据的学习成为重要的研究课题.标签推荐则随着标签网站的迅速发展成为热门的研究问题之一.本文主要研究多标记学习算法,并根据多标记学习与标签推荐的预测结果都是多个元素的特点,对多标记学习算法在标签推荐中的应用展开相关的研究.本文首先对多标记学习与标签推荐的概念进行阐述,分别总结了多标记学习与标签推荐的相关算法,并分析了各算法的优缺点.其次,提出了基于标记间关系的多标记学习算法,该算法对元级特征进行了改进,改进后的简化元级特征保留了元级特征能够表示实例与标记的关系的特点,同时减少了输入空间的维度.在此基础上,该算法提出结合简化的元级特征以及标记空间得到标记间关系矩阵的方法,预测阶段结合该矩阵与简化的元级特征得到预测结果.在多标记数据集上的实验结果表明,该算法能够有效的利用标记间的关系,且更适用于对标记间依赖关系较强的数据集进行分类.最后,根据标签推荐的特点,对多标记学习算法的部分实现进行了改进,提出了用于标签推荐的多标记学习算法.训练阶段,提出了以标签共现次数来计算标签间关系矩阵的方法.推荐阶段,提出了以标签向量来表示用户与资源的历史信息,结合该标签向量与标签间关系矩阵得到推荐的标签集合.在标签数据集上的实验结果表明,该改进算法相较于其他标签推荐算法,较好的利用了标签间关系,推荐的标签集合更准确.
其他文献
作为社会保障体系的重要组成部分,我国的保障建设不仅是改善民生的重大举措,也是我国房地产宏观调控的重要内容。国家“十二五”规划提出兴建3600万套保障性住房的宏伟工程。
摘要:本文的研究是在我国快递产业蓬勃发展,运力资源紧张,对运输业要求提高;高速铁路运输、站场资源丰富,但面临巨大的财务压力,亟需提高资源利用率这两个背景下进行的。2013年
高效率视频编码(HEVC, High Efficiency Video Coding)是由ITU-T和ISO/IEC联合制定的新一代视频编码标准,其目的是为了更显著的提高视频压缩的效率。相比较现有的视频标准H.2
随着科技的发展,人们的生活质量地不断提高,对健康的状况也越来越关注,我国政府也对药品的管理越来越严格并制定了《药品生产质量管理规范》,即GMP。近几年随着制药行业的发
随着"中国智造2025"的提出,我国的科学技术发展进入了新阶段,电气工程及其自动化作为智能化工程的典型代表和前沿技术,可以极大地推动社会经济的进步,有效的提高了人们工作效
随着我国经济快速发展,支撑经济发展所需的大量货物和能源,需要从国外运输进口,海上运输无疑是能源进口的重要形式。但我们应当清醒地意识到,在船舶运输市场一片繁荣景象的背
随着我国交通设施建设的发展,我国已经成为世界上公路隧道规模最大和里程最长的国家,随之而来的是隧道火灾频率的上升和灾难规模的扩大,研究隧道火灾已经迫在眉睫,本文以甘肃新七
与细菌等各种有害微生物的抗争是人类文明史的最重要组成部分之一。目前,抗菌材料在医药卫生、食品包装、水处理等领域都有广泛应用。抗菌材料具有接触抗菌、释放抗菌和抗粘
视联网技术在全国开展的雪亮工程建设中解决了互联社会监控资源、对接安全、资源共享等众多问题。本文介绍了视联动力通过与河北广电的统一合作建设的基于视联网的监控联网平
互联网提供的信息广泛而复杂,限于普通用户的知识储备及认知能力,极易造成用户无法有效地获取、理解与使用信息.推荐系统以海量数据挖掘技术作为基础,不需要用户提出明确的需