中文文献题录数据作者重名消解问题研究

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:xiapehe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在对目前各种作者重名消解方法进行总结的基础上,针对中文文献题录数据特征,将重名消解问题转换为同名作者文献的分类问题,提出一种基于规则和相似度的重名消解框架模型,并对其中的分解规则和合并规则进行详细的算法描述,最后选取3个学科的重名作者数据集进行实验,实验结果表明该模型能有效提高作者重名消解的准确率。 On the basis of summarizing the current author’s method of eliminating the duplicate names, aiming at the characteristics of the data of the Chinese bibliographic data, the problem of resolving the duplicate names into the classification of the author’s authors of the same name is proposed, and a duplicate name resolution based on the rules and similarities is proposed Frame model. The algorithm is described in detail in the disassembly rules and the merge rules. Finally, the data set of the author’s author in three disciplines is selected for experiment. The experimental results show that the model can effectively improve the accuracy of the author’s name resolution.
其他文献
摘 要:对于成功的养猪来说,胆汁的作用可能比人们过去认为的还重要。经验表明,铜由肝脏吸收和储存,随后分泌到胆汁中发挥抗菌作用,从而提高猪的生长速度,改善饲料利用率。  关键词:酶制剂;胆汁;抗菌;生产性能  铜通常被认为具有促进猪生长的作用,这归功于除了可间接提高猪的采食量和生长速度的系统作用外,铜还具有抗菌的特性。最近的研究表明,铜的促生长潜力与日粮中铜的生物利用率之间存在一定的联系。为了解这种
移动互联网的普及和虚拟社区的发展,丰富了互联网用户的网络生活。伴随着经济发展和消费升级,互联网上出现了大量关于知识消费的平台。这些知识消费平台聚集了大量用户形成了
随着社会的快速向前发展,我们的政府、企业和研究机构面临两个问题:一方面社会技术进步日益加快,新的技术不断出现并取代旧技术;另一方面,社会中以各种形式存在的知识越来越多,而且
期刊
企业竞争情报系统的导入与应用,在企业战略规划、市场行为预测、产品研发等关键的商业活动领域具有重要价值,这是毋庸置疑的。然而,究竟有哪些因素会影响竞争情报系统的有效
研究目前公众对公共部门信息服务的关注因素,通过问卷调查的方法,调研公众进行公共部门信息获取时,对公共信息的质量、合法性、版权、获取时间、获取地点、获取成本和来源的
指出RFID技术在国内图书馆的应用越来越广,但业界缺少相关的应用标准,因此在实际应用中存在很多问题。认为需要建立一个规范的数据交换机制,保证数据的安全性、可迁移性,以实
P2P网络是当今非常流行的一种网络结构。区别于传统的C/S模式,在P2P网络中每个节点的地位都是平等的,每个节点既是客户机,又是服务器,所有的数据交换都是在节点间完成。与C/S
随着互联网的发展,信息呈现出指数增长的态势,相对于早期有限的信息来源,越来越多的人们根据自身信息需求,通过多种多样的信息获取途径获得信息。当代未成年人是伴随着互联网
在分析标签共现的基础上,提出一种基于共现的标签谱聚类方法,该方法直接利用标签的共现关系来测度标签的相关性,能够避免将标签表示成向量空间模型时所带来的高维稀疏等问题