基于非结构化数据的专家综合评价技术研究与应用

被引量 : 2次 | 上传用户:sharongd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专家资源是各类组织中最有价值的资源之一,重要的知识保存在专家的头脑中。因此,寻找合适的专家就成为解决重要问题的关键所在。基于专家的研究论文等非结构化数据的挖掘与分析,对专家的研究领域进行评价和检索就成为解决疑难问题的重要工具。专家检索(Expert finding)的目的是要查找某一领域的专家帮助各类组织解决问题,专家不仅需要具备相应的领域专业知识,而且还应具有一定的影响力。为此本文在研究基于非结构化文档内容的专家建模方法基础上,还考虑能够表征专家权威性的专家引用关系。通过融合专家文档内容和引用关系,从而更准确、更全面地对专家进行综合评价。本文在分析相应需求和技术的基础上,建立三层体系结构,分别是信息采集、特征构建和专家检索三大部分,并重点研究了特征构建和专家检索两部分。信息采集主要是根据采集策略从专家信息库、学术数据库、专利信息库等数据源中自动地采集专家信息及相关技术知识资源,并进行清洗、规整、存储。特征构建主要在信息采集部分获取到专家的非结构化数据后,使用基于统计的中文分词技术对文档进行分词,统计分析每个词项在文档中出现的频率,在此基础上基于专家语言模型计算词项与专家的相关度,对词项建立特征构建内容特征库。同时抽取分析文献引用信息,计算关系权重构建专家引用关系网络。然后基于专家引用关系网络使用相关性传播模型对内容特征更新提升,达到平稳状态或经过有限次迭代后,融合专家文档内容和引用关系对专家研究领域建立特征构建专家特征库。用户检索,用户输入查询后,使用中文分词技术切分查询成多个查询词,对于每个查询词从专家特征库中搜索匹配特征,读取特征值作为对专家关于该查询词的评价得分。假设每个查询词相互独立,根据乘法原理合并所有查询词得分,得到对专家在整个查询中的综合评价,然后按序返回专家列表。为了提高用户的检索速度,其中将信息采集、特征构建作脱机处理,在用户发送查询请求时,直接可以得到系统对专家的综合评估。本文最后实现了一个专家信息检索系统,并应用在某大型医药企业中,该系统能够为企业寻找出相关领域的专家,帮助企业解决难题,提高了企业的工作效率,具有较强的应用价值。
其他文献
劳务派遣人员目前已成为事业单位人力资源的有效补充,尤其是随着2008年新《劳动合同法》的出台,对劳务派遣人员的管理提出了更高的要求。该文简要介绍了双因素激励理论,分析
胸膜肺炎放线杆菌(Actinobacillus pleuropneumoniae,APP)在全世界范围广泛分布,给养猪业造成了巨大的经济损失,由于各个国家及地区流行的优势血清型不相同,且该病原菌已经发现的15
新时期对我国大学教学文化的研究,是基于传统教学文化已不能满足大学教学发展的需要,新的教学文化尚未形成,如何构建适宜大学发展的教学文化,是新时期我国大学教学面临的主要
化学是初中教学中必不可少的一门学科,它在学生的学习以及发展中有着至关重要的地位,目前我国初中化学教学中还存在诸多问题,比如,教师教学方法不当、学生学习积极性不强以及
<正>中共河北省七次党代会做出了建设沿海经济社会发展强省的战略决策,为全省交通发展提出了新的任务和要求。分析和研究公路交通与经济发展的基本理论、方法及其应用,对于把
随着计算机信息化建设的高速发展,企业日常研发管理中,出现大量的电子文件。随之而来的问题是如何把这些电子文档进行协调统一的管理,很多电子文件部分或全部仍然保存在各种负责
近年来,高等职业教育的发展受到了社会各界的高度重视。国家出台了一系列政策文件,大力支持和发展职业教育。我国的职业教育也迎来了发展的春天。而职业院校培育出来的学生不
随着网络与经济全球化的快速发展,市场竞争越趋激烈。企业为了追求自身利润最大化,常常会引起不同企业之间利益的冲突:下游零售商为了减少库存,会要求上游供应商以较小的批量
农产品价格波动剧烈,对农业生产、人们生活有着不利影响。准确识别我国农产品价格波动特征,对农产品价格发展趋势进行科学研判,可指导利益相关者采取预控措施规避风险,可为相
烟草对镉的吸收积累具有一定的规律性,镉对烟草的毒害一方面受到不同部位镉的含量和赋存形态影响,另一方面受到外界的环境因素的影响。探明烟草对镉的吸收积累规律,有利于通过外