论文部分内容阅读
入21世纪,人类社会正在由信息社会迈向知识社会,掌握知识、勇于创新的人才成为企业和组织中最有价值的资源。无论是科学研究机构,还是社会生产部门(如企业、工厂),都需要那些拥有丰富专业知识、技能与经验的领域专家来组织团队,指导研发,攻关技术,以此来提高工作或生产效率,而如何通过有效的手段发现这些专家就日渐成为一个重要的科学问题。作为一项检索工作,专家检索近年来受到了很多的关注,成为信息处理领域的研究热点。本文先回顾了专家检索的研究背景、现状,阐述了其研究进展,并就其研究方法如专家建模、链接分析、查询扩展、专家证据识别、隐含主题分析等作了分析和总结,还统计分析了各类测试集,展望了该领域未来的研究方向。针对特定的主题查询已提出了很多排序候选专家的策略。其中最有效的方法是基于支持文档的专家建模,但是这种方法建模查询和候选专家关系时缺少捕获查询和候选专家的隐含语义联系。本文提出潜在主题模型和支持文档相结合的方法。该方法建模查询和支持文档为单词-主题-文档关系,而不是用语言模型建模单词-文档关系,另外,支持文档的先验知识也被考虑来排序专家。在元数据语料库上的实验结果显示潜在主题模型能有效的捕获查询和候选专家的语义关系,因此提高了专家检索的性能。文中给出了评审专家自动分配策略和多类型指标条件下的专家排名,实现了评审专家自动化推荐,并公平可靠地分配候选专家。潜在主题模型的应用研究越来越多,本文所述在生物信息学领域的应用就是一个很好的实例。生物信息学已经发展了大约30年的时间,特别是在过去10年里,该领域的发展一日千里,也出现了许多研究工作。这一领域的无论是一个新手,还是著名学者,都希望能够一睹这一领域的研究现状,并对该领域获得一个直观和量化的了解。本文将利用潜在主题模型,挖掘出生物信息学领域的文献来发现重要的研究课题,量化这些主题的演变来显示这一领域的发展趋势。