考虑新类出现的多变量时间序列数据流的分类研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:wofucyou4444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着不同类型传感器在网络中的广泛应用,多变量数据流的精确分类问题已经成为数据挖掘和机器学习领域的研究热点。由于网络中数据流的特征随时间和网络环境的变化而发生变化,数据流会不断有新的类别产生,导致分类精度下降。目前,已经有大量关于多变量数据流的分类方法,但他们都没有考虑到新类的产生。然而在现实生活中,很多应用领域的数据都会有新的数据类别产生,及时检测到新类别,可以提高分类精度,并且对于实际生活有很大的意义。在目前的数据流分类研究当中,仍然存在三方面的问题没有有效的解决:(1)多变量数据流当中的新类检测问题有待研究;(2)较少的考虑到多变量时间序列数据流当中流内特征之间以及不同流的特征之间的相互影响关系;(3)在单变量数据流的新类检测方法当中,现有的方法假设某一个时间内只出现一个新类,然而现实可能会同时出现多个新的类别。因此,针对上面的三个问题,本文所做的主要工作就是通过引入特殊的特征提取方法以及基于聚类的模型更新方法来研究数据流当中新类检测的问题,并将该方法应用到多变量时间序列数据流当中,研究了流挖掘中的一个重要问题,即考虑新类出现的多变量时间序列数据流的分类研究或CMCNC(The Research on Classification of Multivariable Time Series Data Streams Considering New Classes)问题。为了更加直观、快捷的度量多变量时间序列数据流之间的相互影响关系,本文借鉴了生物信息学当中基序的查找方法,通过提取基序以及时序关系特征,经过向量化处理之后,输入到随机森林分类模型当中进行分类以及新类检测,在对模型进行更新时,利用特征的权重和k-means方法对所有新类实例进行聚类,以达到正确检测新类的目的。实验结果表明,与现有的分类方法相比,本文提出的分类方法不仅考虑到了多变量时间序列数据流之间的时序关系,也达到了新类检测的目的,并且能够提升新类检测的准确率,最终该分类方法取得了显著的效果。
其他文献
单纯疱疹病毒Ⅰ型(herpes simplex virus 1,HSV-1)是一类人群中广泛存在的DNA病毒,通常导致口唇疱疹、角膜炎等疾病。HSV-1在外周组织的上皮细胞进行裂解感染后,可在神经元中
随着大数据时代步伐的到来和智能移动以及智能通信设备的普及,海量的空间数据充斥在人们的生活中。如何利用这些海量的数据,挖掘有趣的知识和规律,来改善人民的生产和生活,是
微波电真空器件因为具有工作带宽宽,输出功率大,效率高等优点,故而被广泛应用于通信、雷达、卫星导航、电子对抗等领域。其中,行波管因为其无与伦比的宽频带特性,成为在上述
目的:观察化痰开痹汤对痰阻心脉型胸痹(冠心病稳定型心绞痛)的治疗效果。方法:从2017年5月至2017年12月在我院住院部干部病区、心血管病区住院患者中收集符合纳入标准的60例
随着通信技术的快速发展,人们对信息传输容量及速率的要求也越来越高。实现更大的数据传输容量是光通信的主要研究方向。其典型方法是复用多个独立的数据信道,比如波分复用(W
目的:探究计算机辅助设计结合三维有限元在股骨近端良性病变精准切除及生物力学重建的方法,评价计算机辅助设计结合三维有限元在股骨近端良性病变精准切除及生物力学重建方面
心力衰竭(heart failure,HF)是大多数心血管疾病的终末阶段表现为心脏收缩/舒张功能障碍的临床综合征。其发病率高,5年死亡率高达50%,匹敌甚至超过了多种癌症,已成为全球范围
超构材料作为一种具有特殊电磁特性的人工结构,具有与常规材料不同的奇特性质,比如负折射率、反向多普勒效应、反向切伦科夫幅值异常光压特性等。自超构材料诞生以来,就引发
目的:探讨缺血性脑卒中患者超声下颈动脉斑块微钙化的特征,评估缺血性脑卒中患者超声下颈动脉斑块微钙化与颈动脉斑块稳定性及动脉粥样硬化性脑梗死的相关性。方法:本研究收
设备到设备(D2D)通信因为其短距离直接通信可以降低时延等优势已经成为未来5G关键技术之一。然而,大量的D2D用户通过与蜂窝用户共享资源进行通信时,使用同频段的用户之间会造