基于改进k-medoids算法的XML文档聚类

来源 :计算机工程 | 被引量 : 0次 | 上传用户：szg6136755

【摘要】

：

XML文档由于其自身的可扩展性、半结构化和自描述性等特点，已成为数据表示和交换的数据格式标准。一个高效、快速的XML文档聚类机制能够大幅缩短信息检索时间，提高数据查询的效

【作者】

：

冯少荣潘炜炜林子雨

【机构】

：

厦门大学信息科学与技术学院

【出处】

：

计算机工程

【发表日期】

：

2015年9期

【关键词】

：

XML文档聚类遗传算法模糊聚类 k-medoids聚类聚类个数聚类中心 XML documents clustering Genetic Algorit

【基金项目】

：

国家自然科学基金资助项目（61303004）,国家社会科学基金资助重大项目（13＆ZD148）,福建省自然科学基金资助项目（2013J05099）.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

XML文档由于其自身的可扩展性、半结构化和自描述性等特点，已成为数据表示和交换的数据格式标准。一个高效、快速的XML文档聚类机制能够大幅缩短信息检索时间，提高数据查询的效率，挖掘出潜在的信息价值。为此，提出一种改进的k—medoids算法对XML文档进行聚类。运用模糊聚类方法确定聚类个数，利用遗传算法的全局最优的搜索能力求解最佳聚类中心点或质心，从而提高大规模XML文档集的聚类质量。实验结果表明，与基于传统k—medoids算法的聚类方法相比，改进的聚类方法具有较高的聚类准确性和收敛度。

其他文献

溴氧化铋基异质结光催化剂的制备及其快速降解17α-乙炔基雌二醇

17α-乙炔基雌二醇(EE2)是一种使用广泛的合成雌激素,可引起人体内分泌系统和神经系统紊乱。EE2在环境水体中普遍存在,给人类带来了严重的潜在健康威胁。寻求高效快速降解17α-乙炔基雌二醇(EE2)的方法是一个重要而充满挑战的课题。在众多去除EE2的方法中,光催化技术是一种绿色高效的方法,在水污染处理研究领域广受关注。本论文通过简单的制备方法得到了AgI/BiOBr和BiOBr/BiOI两种异质

学位

光催化溴氧化铋可见光17α-乙炔基雌二醇快速降解

和谐教育——现代教育的灵魂

现代教育呼唤新的教育理念。和谐教育旨在培养各方面全面、充分发展的个体，重视教育诸方面关系的和谐构建，符合现代教育发展的要求，是现代教育的灵魂。和谐教育是一种思想，更是一

期刊

和谐教育现代教育灵魂harmonious education modem education soul

内镜粘膜下剥离术治疗255例早期胃癌及癌前病变患者的临床总结

目的:1.总结早期胃癌患者的临床特点。2.总结白光内镜下早期胃癌病灶的形态学特征及ME-NBI下的特征性表现,分析早期胃癌的危险因素,为内镜医师行内镜下的初步筛查提供合理化建议。3.总结胃镜活检和内镜粘膜下剥离术(ESD)术后病理在诊断早期胃癌及癌前病变的一致性情况。4.总结ESD治疗早期胃癌及癌前病变的整块切除率、完整切除率、组织治愈性切除率及并发症(出血、穿孔),术后复发等情况,评估ESD治疗

学位

内镜粘膜下剥离术早期胃癌癌前病变

网络在语文教学中的运用

21世纪是网络时代，网络已经取代了传统的信息渠道成为人类生活、工作和学习的最重要的工具。网络时代，教师必须树立全新的教育教学观念，在教学中积极运用网络，构建网络和语文教学

期刊

网络语文教学教学观念network Chinese teaching teaching idea

略论中国古代契约的特点

契约是人们自由意志的结果,是平等主体的当事人之间,基于合意而达成的设立、变更、消灭债的权利与义务的协议.它以当事人的任性为条件[1],体现出当事人的一种自由人格状态,在

期刊

论文本的确定性

文本是一个符号体系,由多重意义构成,而又和谐统一.它的意义可以从外部(社会、文学实践主体)关系上来释义,也可以从文本的内部(语言、话语)结构上去释码.

期刊

和谐统一多重意义

基于堆叠文件系统的云计算存储优化

云环境中大量虚拟镜像带来的冗余会造成资源利用率降低，采用重复数据删除技术能缓解对存储空间以及网络带宽的需求，但同时也存在处理性能下降的问题。为此，提出一种基于堆叠文件

期刊

堆叠文件系统虚拟图像云计算联合文件系统重复数据删除stackable file systemvirtual imagecloud computinga

基于共面点的改进摄像机标定方法研究

为能准确提取物体空间信息实现图像三维重建,对摄像机透视畸变模型及透视投影模型进行研究,在张正友标定法的基础上,提出基于共面点的摄像机非线性标定方法。利用棋盘格角点

期刊

计算机视觉三维重建摄像机标定透镜畸变共面点棋盘格角点computer vision 3D reconstruction camera calibr

基于循环经济的产业结构高度化判别

[摘要] 产业结构高度化一般以三次產业之间优势地位的更迭来判别。本文将产业结构高度化的判别标准与基于循环经济的产业体系的发展要求相结合，提出了基于循环经济的产业结构高度化判别指标的改进，以使产业结构高度化符合循环经济的发展要求，实现经济社会和环境的可持续发展。　　[关键词] 循环经济产业结构高度化

期刊

循环经济产业结构高度化

基于改进k-medoids算法的XML文档聚类

其他学术论文