基于聚类集成的人名消歧算法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:Gloria_SHU
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统人名消歧算法中,每类特征仅反映人物实体的部分信息,且不同聚类算法各有优缺点。提出了一种基于聚类集成的人名消歧算法。从文本中提取上下文特征、实体特征、社会关系特征得到三个相似度矩阵,并对这三个相似度矩阵进行融合得到一个融合相似度矩阵,把这四个相似度矩阵作为输入,利用不同的聚类算法得到不同的划分,采用基于均方误差邻接矩阵聚类(squarederroradjacencymatrixclustering,SEAM)算法对这些划分进行集成,实现人名消歧。在CLP2010人名消歧训练语料上进行实验,结果表明,新算
其他文献
片上网络(NoC)不仅直接影响众核芯片的性能,而且消耗了芯片部分功率,在给定功率条件下使得片上网络的性能最优已经成为迫切需求。片上网络中路由器的工作负载(包的到达率)差异很大,
T3、T4与TSH对甲状腺疾病治疗效果的评价比较李贤蓉,余叶蓉华西医科大学附属第一医院内分泌科T3、T4及TSH是临床上诊断甲状腺机能是否异常的重要指标,特别是TSH尤为敏感,当T3、T4还在正常范围时,TSH的升高
SVM分类算法处理高维数据具有较大优势,但其未考虑语义的相似性度量问题,而LDA主题模型可以解决传统的文本分类中相似性度量和主题单一性问题。为了充分结合SVM和LDA算法的优势
自体LAK细胞回输合用Ara-AMP治疗慢性乙肝的临床观察李勤,程迎祥,王风丽,李莉空军成都医院传染科(610061)慢性乙肝是一种难治性疾病,其主要原因是乙肝病毒长期在体内复制,故抗病毒治疗是根本的治疗方
作者报道215例新生儿麻醉的处理经验,强调新生儿解剖生理发育尚不健全,严格的呼吸管理、适当的麻醉方式、保暖及控制输液是麻醉成败的关键。
针对使用相似度测量进行社团划分时可能出现的判断冲突问题,提出了一种基于相似度的三元社团合并算法。首先计算网络中所有节点相似度,并构建相似度矩阵和阈值矩阵。通过对相似
Sony在2011年提出的Piccolo算法密钥分为80 bit(Piccolo-80)和128 bit(Piccolo-128)。设计者使用包括相关密钥不可能差分在内的多种攻击方法对算法进行了安全分析,认为对于Piccol
针对无线体域网(wireless body area network,WBAN)结合云计算时的数据通信与用户隐私安全问题,提出使用多值和模糊方案(multi-valued and ambiguous scheme,MAS)解决云辅助WBAN
【正】 CIS—企业形象设计的英文缩写,是现代企业管理的一种科学方法。企业通过自身形象设计,在市场中定位,谋求在市场竞争中的优势。CIS在西方一些发达国家臻于成熟,而在中
对89例慢性阻塞性肺病患者和35例正常对照组进行了呼吸系统有效顺应性与吸气功的测定。结果显示COPD各组CE较正常组显著降低,Wi则显著增高。作者认为COPD患者CE降低的原因与继发性肺间质纤维化,胸