论文部分内容阅读
科技论文在科学技术研究和创新中扮演着非常重要的角色,是开展科学研究工作的重要基础条件。然而,在科学研究领域文献信息量的飞速增长,为科研工作者带来极大的不便,尤其对于新进入某一领域的研究者,他们需要一些该领域经典的、权威的文章来指引学术研究的方向。现阶段依靠基于关键字的学术搜索引擎获得的结果并不能很好地标示出用户的需求特征,仍然需要用户进行大量的筛选工作。为解决这一问题,本文借鉴社区划分的方法和概念,对论文引证网络进行社区划分,并计算文章在社区内的影响力来保证推荐文章的质量。此外,针对论文推荐结果本文还提出一个论文推荐结果评价模型来对推荐的论文进行评估。具体工作如下:1)提出基于引证网络和论文社区的经典论文推荐模型。首先,本文借鉴社区划分的方法和概念,提出基于贪心团扩展算法(Greedy Clique Expansion)的论文引证网络社区划分方法,进一步研究论文社区研究影响力的传播规律,提出利用Paper Rank算法计算特定社区影响力排名的模型,为用户推荐感兴趣领域的经典权威论文列表。实验结果表明,该方法与传统论文推荐方法的全局搜索相比,将考察范围缩减到特定的论文社区中,大大减小了算法的复杂度。同时,利用影响力指标进行论文排名,保证了推荐文章大都在本领域具有较高的影响力。2)提出利用文章自身质量以及用户与推荐结果的匹配度对推荐结果构建评价模型。对于文章的质量,本文综合考虑期刊影响因子、文章被引用次数、作者情况、论文下载次数以及论文基金赞助情况,并根据重要性差异赋予不同的权重进行计算。对于推荐结果的匹配度,本文进一步利用社区标签来构建用户兴趣模型和文章特征模型,然后根据余弦相似度方法计算用户兴趣和待推荐文章的匹配度。最后,综合上述文章质量和结果匹配度两个指标,对推荐结果进行评价。实验表明,该方法评价的平均吻合度接近70%。