论文部分内容阅读
传统人名消歧算法中,每类特征仅反映人物实体的部分信息,且不同聚类算法各有优缺点。提出了一种基于聚类集成的人名消歧算法。从文本中提取上下文特征、实体特征、社会关系特征得到三个相似度矩阵,并对这三个相似度矩阵进行融合得到一个融合相似度矩阵,把这四个相似度矩阵作为输入,利用不同的聚类算法得到不同的划分,采用基于均方误差邻接矩阵聚类(squarederroradjacencymatrixclustering,SEAM)算法对这些划分进行集成,实现人名消歧。在CLP2010人名消歧训练语料上进行实验,结果表明,新算