基于二路生成树和融合边界的聚类边界检测算法研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:zxy86983028
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是数据挖掘的主要技术之一,也是学术界研究的热点问题,并在各个领域的数据分析中起到重要作用。聚类边界的识别有助于提高聚类结果的准确性和揭示聚类所具有的特性,对它的研究成为近年来研究的热点,并在聚类分析、虚拟现实、图像处理、医学数据分析等领域中得到了广泛应用。现有的聚类边界检测算法存在着对参数敏感,执行效率低下,不易扩展等缺陷,针对这些问题,本文对聚类边界检测技术进行了深入的研究。为了提高聚类边界检测的效率,提出了基于二路生成树的边界检测算法,该算法首先采用二路生成树的技术对数据集进行聚类,在生成的聚类上采用c-层近邻技术统计每个点的近邻,从而计算出每个点的反向近邻值,根据反向近邻的值快速提取边界点。实验表明该算法的执行效率较高,能够识别任意形状的边界,并且具有聚类和边界的双重功效。为了解决现有边界检测结果对参数敏感和精度问题,提出了融合边界检测思想,即将多个边界检测算法提取的边界结果通过相似图和共识函数进行合并,以求得到一个正确的边界结果,避免非监督学习对数据的未知性而导致错误假设的现象,且不需要输入任何参数。实验结果表明该算法能够有效地处理多密度、任意形状和大小的数据集。
其他文献
“大数据”时代的到来,加快了云计算技术的发展和推广,众多涉及海量数据处理的云平台蓬勃涌现。云计算技术已逐步发展成熟,并深入人们生活、工业和研究的各个方面。MapReduce
汽车的品质特性是衡量汽车制造质量的一个综合性指标。统计表明,整车约1/3的故障问题与车辆的NVH问题有关,国际上各大汽车公司有近20%的研发费用消耗在解决车辆的NVH问题上。汽车后桥是汽车传动系统中的关键部件,其性能直接影响整车品质。汽车后桥主减装配的的故障种类繁多,如齿轮毛刺、异响等。面对这些问题,目前国内外厂商和研究机构多采用测量后桥噪音的办法来确定主减合格与否以及质量特性。齿轮故障诊断一般步
云计算环境下的资源监控是云计算平台体系结构中必不可少的组成部分,为云平台的资源管理、任务调度和负载均衡等提供重要依据。云计算是一种基于互联网的新型计算方式,其宗旨是
用例规约作为用例技术的关键部分,描述了用例的具体内容,定义了用例的细节,对后期各阶段开发工作具有重要的影响。但是,在用例的使用过程中用例规约描述方面仍然存在一些缺陷
学位
随着全球范围内分布式系统发展进程的加快及其构造的日趋复杂,越来越多的失效现象层出不穷,严重威胁着系统的高可用性。失效检测作为保障分布式系统高可用性的核心技术之一,
槽填充(Slot Filling)任务是TAC(Text Analysis Conference)会议于2009年提出的KBP(Knowledge Base Population)评测任务的主要组成部分。作为问答系统和信息抽取中关系抽取
伴随着人们日益增长的多媒体需求,多媒体技术有了突飞猛进的发展。而多媒体技术最核心的部分—视频编解码技术同样也得到了快速的发展。AVS是我国自主研发的音视频编解码标准
与国内典型的报名系统不同,跨境招生报名系统具有用户类型多、用户交流所用语言不统一、系统性能受国际出口带宽限制、系统支撑平台复杂等诸多特点,在此诸多特点下,跨境招生
高血压是严重影响我国居民身心健康的疾病,但是目前我国的医疗卫生条件并不能跟上高血压患者的就医需求,存在“看病难、看病贵”等诸多问题,因此国家大力地推进医疗信息化建