基于随机游走模型的排序学习方法

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:lgxbyc1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的】通过引入随机游走模型,解决有监督排序学习中训练数据的标记信息难以获取的问题。【方法】提出一种基于重启随机游走模型的排序学习方法,通过游走模型完成训练数据的自动标注,降低排序学习对标记数据的依赖性,并在OHSUMED数据集上进行实验。【结果】当已标注样本在数据集中占比50%时,该方法能有效完成排序学习任务,与标注样本占比100%的排序学习算法相比,其排序效果明显优于Rank Net算法,略低于List Net算法。【局限】本文方法要求对每个查询单独进行随机游走,这对实际应用中多样查询下的文档标注工作来说仍然需要花费较多精力来完成。【结论】本文方法有很好的排序学习效果,能有效解决排序学习中训练数据的标注难题。
其他文献
简述了锂辉石-硫酸法生产工艺面临的问题,针对我国矿石提锂工艺的节能措施提出了工程技术解决方案,并对未来矿石提锂节能发展动向提出了几点建议。
<正>《高血压》(Hypertension)杂志2013年8月12日在线发表了一项研究关于高血压性视网膜病变与卒中风险的研究,该研究指出即使在血压控制良好的高血压患者中,其高血压性视网
王雨是20世纪的文献学家,1930年代首次发现并抢救海源阁流散藏书。文章详考王雨生平、交游,分析其主要著作《古籍版本学》《古籍善本经眼录》等,探讨其在我国文献学史上的贡
控股公司内部管理体制研究王凤彬控股公司目前正在我国社会经济生活中发挥着日益重要的作用。控股公司按其所有制性质可以划分为国有控股公司和非国有控股公司,按其是否参与具
在注重教育公平和教育质量的时代背景下,职业教育统筹、职业教育均衡、职业教育一体化构成了中国职业教育公平治理的核心战略体系,进而成为了"中国语境"职业教育公平治理话语
自来学界认为上古时期的“滇池”一直就在今云南高原,由此导致西南上古历史中很多问题无从解决。本文通过搜集、分析现代技术资料和历史文献资料,认为战国后期以前的“滇池”
目的分析双流县居民死亡率、死因分布特点及主要单病伤死因对期望寿命的影响。方法利用2011年双流县死因监测资料和双流县公安局公布的同期户籍人口数,编制寿命表和去死因寿
《尚书·洪范》具有重要影响,但其著作时代颇有争议。丁四新先生《近九十年<尚书·洪范>作者及著作时代考证与新证》一文重审了这一疑案,综合多重证据,除了重新批判刘节《洪
<正> 没有对美的发现,存在于课文中的美就难以转化、难以捉摸、难以渗入学生的心灵。在这个意义上,罗丹的“生活中不是缺少美,缺少的是对于美的发现。”名言,不只是对艺术创
<正> 企业中的组织可划分为三类:一是关于资产的构成与收益的分配的组织,称为财产组织;二是关于产品生产与经营过程的现场作业活动的组织,称为作业组织;三是关于企业财产使用