基于多信息融合的科技文献重要度评价方法的分析与研究

来源 :北京工业大学 | 被引量 : 6次 | 上传用户:zwhc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网信息的快速增长,科研工作者通过科技文献检索平台获取各种信息。科研工作者和科技文献的数量都出现急剧的增长,如何让科研工作者在大量的科技文献数据库中查找到专业领域内的最相关的文献资源,我们需要获得科技文献的重要度。本论文研究的课题是对科技文献重要度的评价。目前评价科技文献重要度方法主要有:1)科技文献的引用计数法评价;2)基于PageRank算法的科技文献重要度评价算法;3)基于HITS的科技文献评价算法。这些算法在评价重要度的时候有一定的局限性:直接依靠引用次数虽然可以直观地看到结果,但是在实际应用中存在着不足,发表时间相对较早的科技文献被引用的次数较多,得到的重要度比较高,但是最近发表的科技文献代表最新的科研成果,可能发表时长较短,没有被大家引用,导致重要度比较低;基于PageRank算法的科技文献重要度评价模型是基于整个科技文献链接网络的,重要度的计算不仅依赖于被引用次数的高低,也依赖于科技文献的重要度,但是它没有充分地利用与科技文献相关的各种属性。基于HITS的科技文献评价算法同样存在着没有利用其它相关属性的问题。本论文针对PageRank算法在评价科技文献重要度方面存在的问题,提出了一种新的模型-FusionRank,利用期刊节点、期刊-年份复合节点、科技文献节点以及作者节点创建了科技文献的多信息融合网络,并设计和实现了FusionRank模型。主要研究内容包括:1)研究影响科技文献重要度的因素:每一篇科技文献都有其通用的基本属性,还有可能会有自身独特的属性。在评价科技文献重要度的模型中,需要充分地利用相关的属性,分析它们对科技文献的影响。主要涉及被引用次数、期刊的影响因子、作者的重要度及发表年份等影响因素。2)研究多信息融合网络:任何网络结构都是节点和节点之间通过相互关联构成的。一方面,构成网络的节点种类很多,在网络中首先必须要包含需要评价的节点,而且还要包含与评价节点相关的其他节点。另一方面,节点与节点之间的关联也很普遍,在构建多信息融合网络时,要把与解决的问题相关的节点及节点之间的关联关系加入到多信息融合网络中,其他的可以直接忽略。这样构建的网络复杂程度较低,运行效率较高,时间复杂度也相对较低。3)构建基于多信息融合的科技文献重要度评价模型,并设计实现。本文在DBLP数据集上进行了FusionRank与PageRank的重要度的实验,并对实验结果进行了比较分析,实验结果验证了FusionRank模型在评价科技文献重要度方面的可行性和有效性。
其他文献
锁模光纤激光器具有峰值功率高、结构紧凑、成本较低等特点,近年来广泛应用于非侵入探测、生物医疗、国防以及太赫兹发生等领域。然而,由于光纤的饱和功率以及激光器内各器件的损伤阈值的限制,锁模光纤激光器的平均输出功率仍然不能满足部分需求。为了获得更高功率的脉冲输出或者特殊波段的脉冲激光,可以搭建光纤主振荡功率放大(Fiber master oscillator power amplifier,MOPA)系
随着近年来我国经济的快速发展和国内企业参与国际分工的不断深化,越来越多的国内企业响应“走出去”战略的号召,选择到海外进行直接投资。2014年,我国对外直接投资总额达到1
近年来,电视技术跨越了从模拟到数字的过程而踏入了飞速发展的黄金时期。作为一种与电视连接的数字化终端设备,数字电视机顶盒已得到广泛的应用。随着数字电视与互联网的不断
仪表和控制系统(Instrumentation and Control System,I&C)是核电厂的神经中枢。数字化仪控系统已广泛应用于核电厂相关系统中,其可靠性评价非常重要。现有核电厂系统可靠性分析以静态事件树/故障树方法为主,不适合描述组件故障具有相关性的可修复系统。马尔可夫模型更合适描述此类系统,但模型复杂度随系统部件增加呈指数增长,实际运用中易出现模型庞大,可读性较差的问题。布
环氧树脂和环氧基复合材料在电子工业中被用作粘合剂、填充剂等,石墨烯的sp2杂化平面二维结构使得它具有极强的刚度和弹性模量,仅仅添加少量的石墨烯就能显著提高环氧树脂的热力学性能。本文基于分子动力学模拟方法,通过随机分布法在石墨烯表面枝接氨基官能团,获得氨基化石墨烯(Aminated graphene,AG)。将AG作为加强基嵌入到环氧树脂中,通过C-N共价键的方式连接AG与环氧树脂,构建不同尺寸的A
移动机器人是一种可以自主移动到目标并实施给定任务的智能系统。在自主移动过程中,它可以利用自身搭载的传感器认知当前位姿以及所处在的环境,躲避障碍物同时进行自主导航。
我国中西部地区多是山地、丘陵等复杂地形,气候变化不定,自然条件恶劣。在这样的环境中架空导线往往长期处于振动状态,易产生疲劳断股、金具损伤,甚至是断线等重大事故。目前,现有的对导线力学特性的研究,多是以常温环境为主,对低温环境下导线的力学特性关注不足,导线的可靠性难以得到保证。在低温环境下,环境温度较低,风速往往较大,导线的弹性模量以及运行张力有所不同。运行张力、抗弯刚度等因素对导线自阻尼特性的影响
蚕业合作社组织管理是在社员(代表)大会、理事会、监事会、社员结构、产权结构等组织结构设置基础上对合作社的运作进行决策管理和盈余分配的过程,是合作社运营管理的系统框架。组织结构是否完整、机构设置是否合理、管理机制是否规范且高效运作,是衡量合作社治理绩效的主要标准。蚕业合作社是南充市推动千亿丝纺服装产业集群发展的重要经济主体,但当前组织结构不健全和管理机制不规范等突出问题使得合作社组织管理效率低下,不
随着定位技术的发展和手机等智能设备的广泛应用,基于位置的服务给我们的生活带来了极大的便利。由于用户在使用基于位置服务时,需要提供精确的位置信息,攻击者可以截获用户
东海内陆架泥质区沉积物沉积速率非常高,沉积记录对环境变化比较敏感,是研究全球气候演化区域性响应的重要载体。本文以AMS14C高精度测年为基础,对S05-3柱状样沉积物的粒度特