中文个人名称规范记录的实体匹配与聚簇

来源 :国家图书馆学刊 | 被引量 : 0次 | 上传用户:lvyuxuan36520091
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文尝试解决国内个人名称规范联合数据库检索结果集基于实体匹配的聚簇问题,分析国内名称规范联合库CCCNA的检索服务和数据库记录特点,提出对结果集记录合并聚簇的思路:首先预处理去除重复和明显的名称语义不匹配记录,再根据提取出的个人实体属性名称、出生年、个人关联的书目题名及关联的外部记录,基于个人实体的语义进行个人名称规范记录聚簇。实证统计结果显示,处理后结果集内的簇数都显著低于处理前的记录条数,与VIAF的关联聚簇结果也验证了本文方法的有效性。但本文书目匹配采取题名匹配,这会丢失一些有用的聚簇信息,后续研究
其他文献
文殊智慧是佛教圣地五台山最突出的佛教文化精华和最鲜明的人文标识.解读文殊智慧并对其实现创造性、现代性的传承转换,或可为现代文明的重构提供一种别样的价值参照.
目的探讨雨课堂在医学留学生内科学临床思维能力培养中的效果。方法选择某校临床医学五年制留学生88名为研究对象,随机分为实验组和对照组,每组各44名。实验组采用雨课堂教学
1934年至1936年的红军长征,在中国以至世界历史上产生了既深且远的影响。比历史更深刻的是精神。长征既书写下震撼世界的长征故事,也熔铸了永放光芒的长征精神,又升华为厚重
以中国通信设备制造业为研究对象,将创新过程分解为2个相互关联的创新链式子阶段(管理阶段和获利阶段),通过构建链式关联网络DEA模型对技术创新的整体及各子阶段的效率进行评价。
随着我国教育体制多元化改革的不断推进,人才培养模式的进一步创新,课程形成性评价教学被越来越多的教育工作者重视并在教学活动中积极实践。文章在充分调研影响《电工电子基
对陇南山区1992~2007年小麦蚜虫发生情况调查监测资料和相应气象资料进行对比分析,结果表明:陇南山区地形复杂,气候类型多样化,小麦蚜虫的发生具有特殊性,在不同的气候带以不同的虫
纪录片的核心是真实。在新媒体语境下,普通人也可以拿起摄像机,记录普通百姓生活的点点滴滴。《住村的日子》以真实客观的表现手法、不加修饰的电视语言,向观众讲述了住村干
花生是山西省重要的油料作物,在全省经济作物中占有重要的地位,通过花生高产示范栽培技术在山西省临县圪垛头村示范点的应用,使产量最高达到4732.5 kg/hm^2。该高产示范重点
通过对八钢高炉入炉原燃料、炉渣、粉尘,污泥等进行取样分析,找出炼铁原料含锌的主要来源。针对目前的生产现状,制定出快速、有效的应对措施,稳定高炉状态,实现安全、绿色、
本文把Langacker和其他学者新近完善起来的入场理论拓展到关系分句层面,探究限制性关系分句、非限制性关系分句、双重关系分句和嵌入式关系分句入场及其识解,揭示英语关系分