基于网络表示学习的作者重名消歧研究

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:zxc473138
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]本文旨在消除文献系统中的作者重名歧义,以解决其导致的文献错误聚合问题。[方法]通过结构化文献数据建立作者网络、文献网络以及作者-文献网络,来融合不同网络表示学习方法获得文献节点表示,并采用无监督学习方法,将文献节点表示作为特征,使用层次凝聚聚类按照真实作者对文献进行正确划分。[结果]在ArnetMiner、CiteSeerX和DBLP三组数据集上进行实证研究,本文提出的方法在网络稀疏的情况下仍然具有较好的效果,macro-F1值在次优模型基础上最高提升了6%。[局限]仅对英文情境下的作者重名消歧进行了探究,后续将研究更多语言情境下的作者重名消歧问题。[结论]基于网络表示学习的方法能够有效解决作者重名消歧问题,实验结果对于改进科研合作推荐、引文推荐以及知识网络相关研究具有重要意义。
其他文献
运用文献研究、问卷调查和数理统计分析法,对格子铺这一营销实践中的新型零售业态进行了理论与实证的研究。通过因子分析、相关分析获取了格子铺商业价值的衡量指标(进店率、
高炉煤气的合理使用与节能潜力鞍山热能研究院王政民高炉煤气是钢铁企业的重要二次能源,我国目前年发生量己超过1570万tce,占全行业总能耗量的12%以上。高炉煤气数量巨大,而其应用却一直未
在对物流管理专业课程体系现状与重构背景分析的基础上,总结了产业转移背景下物流管理人才需求的特点,构建了职业综合能力和职业拓展能力并重,由综合素质课程和职业能力课程组成
贺兰山岩画是世界岩画的一个重要构成部分。本文从岩画分布地点、表现主题、制作方法及作画功能等方面,分析了贺兰山岩画与世界各地岩画的异同,并指出了其具有的特殊性。
<正>一、悬挂犁使用前的准备 1.犁烨数的配备,可按下列公式计算确定,犁体数=牵引力利用系数×挂钩牵引力/土壤比阻×耕深×耕宽(注:牵引力利用系数一般取0.8-0.95)。另外从直
带状疱疹是由水痘-带状疱疹病毒感染引起的一种以沿周围神经分布的群集疱疹和神经痛为特征的病毒性皮肤病[1]。临床常规以阿昔洛韦及聚肌胞抗病毒、吲哚美辛止痛消炎和局部对
以影响链式产业集群创新网络中合作者决策的因素为变量,构建了链式产业集群企业创新合作意愿度影响因素模型,并运用演化博弈理论研究了集群企业创新合作行为的演化过程。模型分
目的探讨盐酸替罗非班在老年急性ST段抬高型心肌梗死急诊冠脉介入治疗中的临床疗效和安全性。方法湖南旺旺医院2011年4月至2013年6月收治老年急性ST段抬高型心肌梗死患者90例
<正>报载,美国的60多万流浪汉中,有几十万是携家带眷的。看了这则新闻,大家一定会认为是件奇事。不过,有关流浪汉的事,比这更奇的还很多。蓬头垢面、一身褴褛蜷缩在街头的流