检索重排序和文献权威度判定方法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:wind1120
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文献检索是科学研究中非常重要的一项任务。搭建文献检索系统的意义是:能够有效地让科技工作者检索到与其领域相关的科技文献,借以提高研究效率。针对这一任务,本文给出两项研究工作,分别是基于相悖理论的检索结果重排序方法和基于HITS算法的科技文献权威度自动判定方法。基于相悖理论的重排序方法(简称悖向重排序),侧重利用已有的相关与非相关判定结果,对文献检索列表进行重排序,提升用户检测到相关科技信息的概率。由于检索系统的缺陷,“倔强”非相关结果充斥检索列表,难以被准确识别和屏蔽,悖向重排序的关键问题即是构建准确而纯粹的悖向查询意图,作为识别“倔强”非相关结果的标杆。本文针对此问题,提出了两种悖向重排序方法,分别是使用层次聚类的悖向重排序方法和基于相关子主题消解的悖向重排序方法。首先使用层次聚类解决查询意图描述的泛化问题,然后进一步使用相关子主题消解的方法,获得更加精确的正向意图,从而优化重排序性能。科技文献权威度自动排序侧重建立一种有效的权威度度量过程,以及基于权威度的检索结果推荐机制,借以实现权威科技文献的快速检索。其中,权威度的自动判定是实现这一目标的关键问题。本文提出的基于HITS算法的文献权威度判定方法。其核心思想是以引文形成的关联网络为线索,通过使用基于关联关系度量权威性的HITS算法,实现自动的文献权威度计算。
其他文献
信息物理融合系统是一类将数字化、网络化系统与物理过程密切融合的设备系统,它集通信(Communication)、计算(Computation)和控制(Control)于一体,通过此3C技术的有机融合和
在高压开关柜中,由于触头、母线等过热,从而导致绝缘损坏而引起故障,最终导致短路、爆炸等严重后果。因此,高压开关柜温度实时监测,是电力系统安全、可靠运行的重要保障。由于高压
数据查询是两层传感网中用户获取和分析感知数据的重要手段。由于感知节点大都部署在无人值守、复杂多变的环境中,使得不完全数据广泛存在于两层传感网中,丢弃这些数据会降低查
无线传感器网络是传感器技术、嵌入式计算技术、分布式信息处理技术和通信技术迅速发展的结果。无线传感器网络由分布在检测区域内的无线通信节点以自组织的方式组成。作为一
随着电子商务系统的日益发展,用户的感知度不断提升,人性化的应用需求迅速增长,日益增长的用户消费数据占据着越来越多的存储空间,这些海量数据包含着很多非常有用的信息,如
利用计算机视觉技术实现农产品的自动筛选已经得到一定程度的应用。通过物体的形状、纹理差异等特征值的差异,已经实现了对大麦、小麦等不同种类物体的高效分选。通过物体二维
随着互联网的快速发展和日益普及,网络对安全保障提出了非常高的要求,网络安全已经成为人们关注的焦点。传统的网络安全防范体系主要是指通过防火墙、入侵检测、防病毒等被动
B样条方法由于采用了具有最小支撑性质的样条基函数,使得其不仅保持了用控制点定义曲线曲面等良好性质,而且解决了Bezier方法所固有的缺陷,如不具有局部修改性质以及在描述复杂
近年来,随着人工智能Agent技术和社会网络的快速发展,复杂动态社团网络中的牵制控制问题受到了各领域专家学者的广泛关注。牵制控制策略是一种简单、有效且实用的控制方法。它
数据流聚类算法是一项关键的数据挖掘技术,在数据流聚类研究中,算法框架可以分为两类:single-phase model 和 two-phase scheme。应用 two-phase scheme 的基于密度网格的数