【摘 要】
:
在基因微序列分析等应用中,传统以距离为相似度计算依据的方式并不适用,因为有时对象与对象之间不具有相近的物理距离,但却存在有相似的一致性模式。因此,基于模式的聚类方法
论文部分内容阅读
在基因微序列分析等应用中,传统以距离为相似度计算依据的方式并不适用,因为有时对象与对象之间不具有相近的物理距离,但却存在有相似的一致性模式。因此,基于模式的聚类方法(Pattern-Based Clustering)简称为“模式聚类”,被提出来解决此类问题。判断两个对象是否同属一pCluster,取决于他们属性中的子集是否具有一致性的模式。当前模式聚类算法的研究只是停留在一般化描述,并没有上升到系统理论层次,缺乏严格的形式化定义。另外,现阶段算法都是基于特定的等差或等比模式,而对于其他模式却不能够很好的适用。本文对模式聚类各种算法模型进行深入探讨与分析,总结其共性及特性。在理论研究方面,首先从模式的多样化角度进行了分析,对模式出现的类别及特征进行了概括总结,并提出了单模式模型及多模式模型的概念。从模式的多样性和共性出发,总结了模式的通用定义和形式化表示方法。引入了一个具有普遍意义的模式算子来表示模式,并从算子的角度归纳总结各个模式聚类模型的一致性规则表示并进行分类。引入了同型算子和基于算子的模式的概念,以算子的特性研究为基础,研究模式聚类各类运算的性质和特征。在算法研究方面,本文提出了一种新的模式聚类改进算法——0-SM算法,与原有模式聚类算法比较,此算法具有更好的时间效率。
其他文献
随着计算机网络规模和应用领域的日益增大,网络已经成为人们日常工作和生活的重要工具。但是由于网络复杂性和异构性的不断增加,通过网络传播的病毒数量和各种人为破坏因素越来
随着数据中心存储规模的快速增长,以硬盘为主要载体的存储系统可靠性成为影响计算机系统可靠性的关键因素。然而传统的容错机制,如硬盘镜像、纠删码等,还存在着存储成本较高、故
Web服务技术是企业内部和企业之间应用集成的有效解决方案。服务组合是指将多个成分服务按照其功能、语义以及它们之间的逻辑关系组装提供聚合功能的新服务的过程。随着相似W
电力系统潮流计算指在一定系统参量条件下,对电压、有功功率和无功功率在电网中分布的计算,最终来确定该电力系统稳态运行时的各支路功率分布、电压的相角与幅值以及线路功率的
城市可持续发展的呼吁使得公众的环保意识提高,大气环境污染,已经成为人们倍受关注的城市环境污染问题之一。为了有效地治理大气环境污染,首先须对大气环境质量作出科学评价。这
计算机支持的协同工作(CSCW)是目前国际上计算机领域研究一个的热点问题。群体感知理论的研究与应用是计算机支持协同工作的重要研究内容之一。良好的群体感知是群组协作的基
数据仓库是一种语义上一致的数据存储,它充当决策支持数据模型的物理实现,并存放企业战略决策所需信息。本文所阐述的是面向环保领域的分布式数据仓库系统的设计与实现,以及
网元管理系统(OMC)一般由设备厂商提供,实现对本厂商网络设备的操作和维护等功能;网络管理系统(NMS)要求能够管理多种不同设备厂商的网络设备实体,一般从OMC采集数据。两者之间
近年来,随着现代化生产和工业化规模的不断扩大,在我国许多城市都普遍存在着众多的重大危险源,然而由于安全生产管理体制的障碍,导致我国很多企业的生产安全基础薄弱,生产事故屡屡
在当今计算机应用中,都不同程度地使用了图形技术。随着图形技术日益广泛的应用,对计算机绘图方法的研究也日益重要。目前我们广泛使用的图形显示器是光栅扫描显示器,所以光栅图