基于主题模型的专家检索及应用挖掘

来源 :云南大学 | 被引量 : 0次 | 上传用户:weiandlu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
入21世纪,人类社会正在由信息社会迈向知识社会,掌握知识、勇于创新的人才成为企业和组织中最有价值的资源。无论是科学研究机构,还是社会生产部门(如企业、工厂),都需要那些拥有丰富专业知识、技能与经验的领域专家来组织团队,指导研发,攻关技术,以此来提高工作或生产效率,而如何通过有效的手段发现这些专家就日渐成为一个重要的科学问题。作为一项检索工作,专家检索近年来受到了很多的关注,成为信息处理领域的研究热点。本文先回顾了专家检索的研究背景、现状,阐述了其研究进展,并就其研究方法如专家建模、链接分析、查询扩展、专家证据识别、隐含主题分析等作了分析和总结,还统计分析了各类测试集,展望了该领域未来的研究方向。针对特定的主题查询已提出了很多排序候选专家的策略。其中最有效的方法是基于支持文档的专家建模,但是这种方法建模查询和候选专家关系时缺少捕获查询和候选专家的隐含语义联系。本文提出潜在主题模型和支持文档相结合的方法。该方法建模查询和支持文档为单词-主题-文档关系,而不是用语言模型建模单词-文档关系,另外,支持文档的先验知识也被考虑来排序专家。在元数据语料库上的实验结果显示潜在主题模型能有效的捕获查询和候选专家的语义关系,因此提高了专家检索的性能。文中给出了评审专家自动分配策略和多类型指标条件下的专家排名,实现了评审专家自动化推荐,并公平可靠地分配候选专家。潜在主题模型的应用研究越来越多,本文所述在生物信息学领域的应用就是一个很好的实例。生物信息学已经发展了大约30年的时间,特别是在过去10年里,该领域的发展一日千里,也出现了许多研究工作。这一领域的无论是一个新手,还是著名学者,都希望能够一睹这一领域的研究现状,并对该领域获得一个直观和量化的了解。本文将利用潜在主题模型,挖掘出生物信息学领域的文献来发现重要的研究课题,量化这些主题的演变来显示这一领域的发展趋势。
其他文献
随着互联网技术应用的普及与推广,其用户数量急剧增长,应用形式层出不穷,网络的安全问题愈发严重,安全防御手段缺乏统一性和主动性的缺点也凸显出来。本文以网络安全风险管理
近年来,随着分布式数据库的应用越来越广泛,分布式数据库查询优化方法的研究一度成为分布式数据库领域的研究热点。然而其中的多连接查询优化问题却一直都没有得到很好的解决
汽车发动机的工作状况直接影响汽车的动力性、可靠性以及安全性。现有的汽车发动机综合故障诊断技术依赖于多种传感系统和专家的先验知识,不利于在车载系统上使用。因此,探索
软件技术发展至今已产生大量的方法和模型,但任何检验、验证手段都还不能发现并排除所有的软件缺陷。从第一个软件诞生,就伴随出现软件缺陷的检测和预测技术。检测技术在于发现
语音是人类之间最自然、最便捷、最有效的沟通交流方式,是人类的显著特征之一。语音识别技术可以将语音转换成相应的文本,是人类与机器进行交互的关键环节,更是实现人工智能技术
空间环境科学数据共享平台来源于子午工程项目。该平台充分利用最新的网络技术,建立基于互联网环境的在线数据共享技术系统,及时收集、整理、整合空间环境数据资源,为空间环
在深亚微米工艺下,众核处理器芯片设计遇到了来自以下几方面的挑战:由于晶体管面积不断减小,单位面积上的功耗在不断上升;芯片面积不断增大导致时钟网络非常容易受到在片波动的影
目标检测算法的目标是在没有人工干预的情况下,利用计算机视觉的方法,从摄像机拍摄下来的视频图像序列中快速、准确的检测出前景运动目标,并对目标进行定位和识别。目标检测
本文从搜索引擎搜集网页,去除网页中的噪音和冗余的角度,对收集到的网页集合做网页正文提取,得到与主题相关的文字内容,用于后续的内容分析(分词、主题词识别、摘要等等)和检
搜索引擎从海量数据中按需为用户检索信息,如何让用户快速理解检索结果,并从中筛选出真正符合检索需求的网页?在这个课题中,网页关键信息的发掘与提取发挥着重要作用。本文从