基于改进k-medoids算法的XML文档聚类

来源 :计算机工程 | 被引量 : 0次 | 上传用户:szg6136755
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML文档由于其自身的可扩展性、半结构化和自描述性等特点,已成为数据表示和交换的数据格式标准。一个高效、快速的XML文档聚类机制能够大幅缩短信息检索时间,提高数据查询的效率,挖掘出潜在的信息价值。为此,提出一种改进的k—medoids算法对XML文档进行聚类。运用模糊聚类方法确定聚类个数,利用遗传算法的全局最优的搜索能力求解最佳聚类中心点或质心,从而提高大规模XML文档集的聚类质量。实验结果表明,与基于传统k—medoids算法的聚类方法相比,改进的聚类方法具有较高的聚类准确性和收敛度。
其他文献
17α-乙炔基雌二醇(EE2)是一种使用广泛的合成雌激素,可引起人体内分泌系统和神经系统紊乱。EE2在环境水体中普遍存在,给人类带来了严重的潜在健康威胁。寻求高效快速降解17α-乙炔基雌二醇(EE2)的方法是一个重要而充满挑战的课题。在众多去除EE2的方法中,光催化技术是一种绿色高效的方法,在水污染处理研究领域广受关注。本论文通过简单的制备方法得到了AgI/BiOBr和BiOBr/BiOI两种异质
现代教育呼唤新的教育理念。和谐教育旨在培养各方面全面、充分发展的个体,重视教育诸方面关系的和谐构建,符合现代教育发展的要求,是现代教育的灵魂。和谐教育是一种思想,更是一
目的:1.总结早期胃癌患者的临床特点。2.总结白光内镜下早期胃癌病灶的形态学特征及ME-NBI下的特征性表现,分析早期胃癌的危险因素,为内镜医师行内镜下的初步筛查提供合理化建议。3.总结胃镜活检和内镜粘膜下剥离术(ESD)术后病理在诊断早期胃癌及癌前病变的一致性情况。4.总结ESD治疗早期胃癌及癌前病变的整块切除率、完整切除率、组织治愈性切除率及并发症(出血、穿孔),术后复发等情况,评估ESD治疗
21世纪是网络时代,网络已经取代了传统的信息渠道成为人类生活、工作和学习的最重要的工具。网络时代,教师必须树立全新的教育教学观念,在教学中积极运用网络,构建网络和语文教学
契约是人们自由意志的结果,是平等主体的当事人之间,基于合意而达成的设立、变更、消灭债的权利与义务的协议.它以当事人的任性为条件[1],体现出当事人的一种自由人格状态,在
期刊
文本是一个符号体系,由多重意义构成,而又和谐统一.它的意义可以从外部(社会、文学实践主体)关系上来释义,也可以从文本的内部(语言、话语)结构上去释码.
云环境中大量虚拟镜像带来的冗余会造成资源利用率降低,采用重复数据删除技术能缓解对存储空间以及网络带宽的需求,但同时也存在处理性能下降的问题。为此,提出一种基于堆叠文件
为能准确提取物体空间信息实现图像三维重建,对摄像机透视畸变模型及透视投影模型进行研究,在张正友标定法的基础上,提出基于共面点的摄像机非线性标定方法。利用棋盘格角点
[摘 要] 产业结构高度化一般以三次產业之间优势地位的更迭来判别。本文将产业结构高度化的判别标准与基于循环经济的产业体系的发展要求相结合,提出了基于循环经济的产业结构高度化判别指标的改进,以使产业结构高度化符合循环经济的发展要求,实现经济社会和环境的可持续发展。  [关键词] 循环经济 产业结构 高度化