基于深度学习的个性化引文搜索推荐算法研究

来源 :西北农林科技大学 | 被引量 : 0次 | 上传用户:wjk123465
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
恰当的引用文献对于撰写学术文献有着至关重要的作用,可以表示作者在自己的研究领域知识面覆盖程度,同时也能帮助作者去论证自己的观点。据DBLP(Digital Bibliography&Library Project)统计,在计算机相关领域每年约有三十万篇学术文献发表,可见学术文献数量增长速度如此之快,因此如何帮助科研人员从大量的学术文献中挖掘出适合自己的科研文献是一件极有意义的事情。搜索和推荐是解决上述问题的两个有效的技术手段。本文在Lucene搜索排序算法上,以深度学习为背景,挖掘用户的个性化兴趣模型,探索引文推荐相关算法存在的不足,最终完成基于深度学习的个性化引文搜索推荐的相关算法研究。论文的研究工作如下:(1)提出基于深度学习的个性化搜索算法。在构建个性化搜索算法过程中首先要构建用户的个性化兴趣模型,论文基于LSTM和Attention机制重构了深度学习Seq2Seq模型,进而应用其将用户的研究兴趣点挖掘并且进行向量化表示。其次在Lucene搜索引擎排序算法的基础上融合兴趣模型进而重构排序算法。最终将搜索结果根据重构的算法进行重排序得到个性化搜索结果。实验表明,基于Seq2Seq模型的用户兴趣挖掘方法的个性化搜索算法较传统兴趣表达方法的个性化搜索在MAP指标上提高了11%,在P@10测评指标提高了28%。由实验结果可知本文提出的算法可行并且效果有一定优势。(2)提出多因子融合的引文推荐算法。针对传统引文推荐算法只考虑单一特征导致推荐结果过于专门化和推荐质量较低等问题,提出一种多因子融合的引文推荐算法。该算法将整体影响力因子、局部活跃度因子、查询相关度因子及作者相关度因子通过多特征因子融合模型进行有效融合。其中,查询相关度因子是通过融入ID2vec改进重启随机游走算法的状态转移矩阵初始权重实现。在AAN数据集上进行的实验结果表明,多因子融合的引文推荐算法相比GloPageRank、TopicSim、BM25模型在召回率上都有相应的提升。其中改进的重启随机游走算法相比原有算法在召回率上提升了8.13%,在NDCG上提升了29.7%。由实验结果分析可得,多因子融合的引文推荐算法可以有效提升引文推荐质量。(3)个性化搜索推荐原型系统的实现。结合本文研发的相关算法,基于目前流行的WEB相应框架和常用的搜索引擎框架,实现了个性化引文搜索推荐系统。
其他文献
<正> 在笔者受理的检验、鉴定中,有很大部分为土制枪支,为对该类枪支的致伤机理、结构、种类、检验鉴定有一概括以供同行参考,现综述如下: 1 土制式手枪的致伤机理 与制式枪
回顾临床运用大青龙汤的经验,心得体会有三:一、立法处方前要有清晰的病因病机认知,即该"里热、烦躁、无汗"是缘由于表寒过甚、皮毛闭塞、阳气郁闭于内而不能外达;二、要有温
目的:探讨肩关节镜下带线锚钉内固定术治疗复发性肩关节脱位的效果。方法:选取复发性肩关节脱位患者76例,随机分为观察组与对照组各38例,观察组采用肩关节镜下带线锚钉内固定
公众参与是生态文明实现的保障,生态文明建设更需要全社会的共同参与。公众参与视角下生态文明建设可尝试从以下几个途径入手:第一,创造良好环境,提升主体意识。要坚持政府引
目的:考察不同制备工艺对参麦注射液质量的影响。方法:采用3种生产工艺制备参麦注射液,用HPLC测定红参药材以及不同工艺制备的红参中间体和参麦提取液的指纹图谱,并测定人参
通过采用油熏法、“502”胶熏法、制模法、“502”胶碘熏法对各种客体上的灰尘减层手印提取固定进行了研究分析,并探讨了其特点、适用场合、差异的原因以及相关建议和应注意
近年来的马克思主义大众化研究中有一个引人注目的实践转向,也就是从传统的认识论领域的研究转向生活实践层面的探讨,这可以看作是以往认识论领域研究的深化和发展。转向实践
目的:研究化州柚提取物的止咳化痰平喘作用。方法:采用小鼠氨水引咳法和豚鼠枸橼酸引咳法观察止咳作用;用小鼠酚红排泌法和大鼠毛细玻管排痰法观察化痰作用;用喷雾致喘法观察
崇祯二年(1629年),由徐光启主持的历局正式开始了酝酿已久的参照西方天文学改革历法的活动。这是明末西方天文学东渐过程的高潮,其直接成果是在中国历史上首次有系统地引进
基于第三代半导体材料的GaN高电子迁移率晶体管(HEMT),运用传输线变压器(TLT,Transmission Line Transformer)宽带匹配技术,研制了工作于VHF/UHF频段的功率放大器。采用推挽的结