基于持续时态的数据挖掘技术研究

来源 :科学时代·下半月 | 被引量 : 0次 | 上传用户:moccaaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘 要】随着科学技术的不断发展,数据越来越多数据冗余相当严重,这就对用戶使用数据造成了一定阻碍,于是数据挖掘技术应运而生。近年来,科学技术发展越来越快,数据挖掘技术研究的进步和发展也越来越明显,并且伴随着数据时代的到来,促进了数据挖掘技术的发展和提升,从而将数据挖掘技术带入到了一个全新的时代。本篇文章主要是对大数据的介绍,并对数据挖掘的概念进行分析,从而帮助了大数据时代的挖掘技术的发展和应用领域的开发。数据挖掘技术得到了一定程度上的发展,给广大用户带来了一定程度上的便利。本文就数据挖掘技术展开研究分析,主要是对基于持续时态的挖掘技术的研究。
  【关键词】数据;持续状态;数据挖掘技术;研究和提取
  0.前言
  信息技术的发展,使人们处于信息的海洋,但对于知识的汲取与使用却有一定的困难,用户往往要花费大量的时间去寻找自己需要的信息。对于大量的数据,要采取一定的科学技术方法进行分析,得出有用的价值为用户提供利用,这样才能发挥出信息的价值,减少时间的浪费。传统的数据挖掘只是对数据的简单分析,建立数据仓库,利用挖掘方法分析,但现在许多的数据都是以时间为基础的,需要建立以时间序列为基础的数据挖掘模型,利用数据挖掘方法对数据进行分析,展现出这些数据依时间变化而变化的特点,更深层次的反映数据所要展示的信息。
  1.数据挖掘的概念介绍
  1.1大数据
  大数据是在信息社会发展下所产生的,是将大量的数据资料,用特殊的数据处理方法进行分析,将信息优化,具有更强的决策影响力,大数据其实是一种信息资产,为社会提供利用。大数据具有很多的特点,其中数量多,速度快,种类多,具有价值是几个比较明显的特征。大数据虽然具有相当多数量的数据,但大数据的意义不仅仅是数量多,而是对这些数据进行分析,进而得出具有价值的信息,为社会生产提供利用,重点是分析方法,掌握到合适的数据分析方法才可以进一步实现数据的价值。
  大数据由于自身的数据量,需要依靠分布式架构的计算机,这需要一定的计算机技术。近年来云计算的发展可以为其提供便利,云计算可以提供分布式数据库,可以分布式处理,解决了大数据下数量多的问题。云计算为数据的计算提供足够大的空间,方便于数据处理,对于大数据的处理需要很多的计算机技术支持,云计算平台只是其中一个。大数据的发展与计算机技术相互影响,互相促进,共同为社会生产提供便利。
  1.2数据挖掘
  数据挖掘是通过算法对数据进行分析,从而发现数据中的信息,为社会生产提供利用。数据挖掘主要是利用计算机技术对数据进行统计分析等方面的计算。对数据进行优化处理,使信息有序化,提取出有用的信息,为用户提供利用。数据挖掘可以得出一些有用的信息,但是,数据挖掘也有许多信息无法得出,需要对数据挖掘技术进一步的研究,促进数据挖掘的发展。
  2.持续时态数据
  时态数据是主要以时间为主要序列的,与时间的变化有很大的关系。现在许多社会生产活动是以时间变化为主要依据的,所以,时态数据有很大的作用,对于时态数据的研究也会越来越多,对于数据挖掘也要研究基于时态数据的挖掘技术。时态数据也分为断续的,持续的,持续的时态数据是指时间连续的时态数据,这些数据是不间断的,而且是以时间顺序为顺序的。以往研究数据挖掘只是一个时间点的数据分析,展示的只是静态信息,而时态数据是不间断的时间点的数据分析,展示的是数据的动态变化,从时间变化角度上研究数据的特点,可以得出更加有价值的信息,对某一事件的变化规律研究提供了数据支持,促进社会生产效率的提高。虽然时态数据很大程度上分析了时间变化过程中事件的变化规律,但再怎么持续研究,终究是一个时间点上的数据分析,并不能代替时间段上的变化规律,所以对于时态数据的研究仍需进一步的进行,从而得出更加有价值的信息。
  3.数据挖掘的基本的分析方法
  随着大数据的发展,数据挖掘技术也日益发展,现在已经研究出了许多的数据挖掘方法,包括分类、特征、web页挖掘等等。其中聚类,关联,分析和预测是比较常用的几种挖掘方法。本文主要从这三种方法入手,对数据挖掘技术进行分析,希望可以为大数据用户提供更多的便利,利于信息的获取,促进社会生产的发展。
  3.1进行聚类分析的方法
  聚类分析是指在数据挖掘时,依据一定的标准把数据分为几个类别,要保证同一类别的数据相似性最大,不同类别之间的数据差别性最大,通过这些相似数据和差异数据的分析,得出数据的特征,提取出数据中所包含的信息,为用户提供利用。聚类分析中最主要的是聚类标准的选择,聚类标准的合适与否决定着提取出的信息的有用性,聚类标准过大或过小,都会对所得出的信息有很大的影响。所以在利用聚类分析时,一定要明确所需要的信息,然后选择一个最合适的聚类标准对数据进行分类,得出整体数据的信息。聚类分析方法主要应用在一些消费者类型分析和市场的划分等等。
  3.2进行关联分析的方法
  关联分析是对数据中所存在的一些数据项之间的关系的研究,数据之间存在着许多的关系,这些关系对于数据的变化与分析研究有很大的作用,对于这些关系的研究有利于数据中信息的提取。关联也就是数据中的一个数据项的变化会影响其他的一些数据项的变化,通过对这些关系的研究可以得出一些有用的信息。比如说某个商店通过对日常销售产品关联的研究分析可以得出啤酒与尿布之间有很大的关联关系,商店就可以将二者放在同一区域促进销售。这类分析方法适用于市场调查和对消费者的分析,可以得出一些商品之间或者消费者需求行为的一些信息,从而促进销售。
  3.3进行分类和预测的方法
  分类是采取一定的分类器,对数据进行分类,通过对不同类之间数据特征的分析,得出相应的信息为用户提供利用。分类法对于分类器的要求比较高,能明确的看出数据类别间的关系,从而进行数据分析。预测方法主要是回归分析,通过对数据某一属性的特征的研究,利用函数得出预测值,还可以计算两个事物之间的相关关系,分析他们之间的相关性,为用户提供有价值的信息。
  4.基于持续时态的数据挖掘
  基于持续时态数据的挖掘也可以利用以上的几种方法,做一些相应的变化。还有两种更加适合时态数据,比如规则挖掘和模型挖掘。
  规则挖掘是对数据的特征提取,提取出时间特征,这些特征可以反映整个数据的特征,进而得出一些需要的信息。模型挖掘是利用截尾的方法分析数据状态的变化特征,选取一个时间段,对这个时间段进行研究分析,得出时间段内数据的特征,在对比不同时间段的数据,得出整体数据中的信息。基于时态数据的挖掘主要是以时间为主要内容,分析时间变化过程中的数据,得出数据变化的特征,进而提取有用的信息。
  5.结语
  在信息社会中,大数据时代是必然的发展趋势,对于数据挖掘的研究有很大的意义,尤其是持续时态数据挖掘技术的研究,现在的社会,生活节奏非常快,每个人都在争分夺秒,数据的传递更是具有这种特点,所以,对于持续时态数据挖掘技术的研究具有很大的影响力。本文主要是以传统数据挖掘技术为基本,进行一些相应的改变,使数据挖掘方法适用于时态数据的研究,为用户提供有价值的信息,促进社会生产的发展。
  参考文献:
  [1]姚家奕.多维数据分析原理与应用.北京:清华大学出版社,2004,51-57.
  [2]赵克勤.集对分析及其初步应用[M].浙江科学出版社,2000.
  [3]高岩.覆盖粗糙集研究[D].西南交通大学博士论文,2010.
  [4]靳孝芳.粗糙集理论在关系数据库知识发现中的应用研究[D].电子科技大学硕士论文,2011.
其他文献
【摘 要】近几年我国地震灾害多发,地震中伤亡人数多的一个主要原因是房屋的抗震性差。在人口越来越密集,建筑物越盖越高的今天,地震给人类带来的灾难性影响也越来越大。如何加强对现有建筑抗震性改造,如何加强新建筑的抗地震灾害能力,需要建筑行业从业者从理论和实际出发,不断的进行研究。  【关键词】建筑结构;抗震;加固  地震是一种自然现象,是人类难以预知,难以抵抗的自然灾害。地震造成地壳板块的断裂、变形,形
据美国《连线》杂志报道,近日,专家在美国华盛顿举行的一次讨论会上指出,未来二十年可实现载人火星登陆任务。但是最新一项研究报告显示,未来载人火星登陆任务最大的障碍是宇
【摘 要】针对水工大体积混凝土常遇到的温度裂缝和耐久性的问题,本文从材料的选择优化上分析了大体积混凝土材料的特性选择和未来的发展趋势,综合考虑大体积混凝土配合比、大体积混凝土动态强度特性、变形特性和损伤断裂特性等等。浅析水工大体积混凝土的优化应从原材料和配合比的选择优化与设计优化入手,提高大体积混凝土的耐久性。  【关键词】水工大体积混凝土;材料;耐久性;配合比  混凝土是一种由多相介质组成的复合
为探究吕家坨井田地质构造格局,根据钻孔勘探资料,采用分形理论和趋势面分析方法,研究了井田7
【摘 要】电能计量一体化实训室可用于训练装表接电、计量装置配置、计量柜运行维护、相位检测分析一体化教学。电能计量实训室网络化后,在实现原有的培训功能以外,可以使老师只用一台电脑即可控制所有设备、并获取学员的训练结果,从而节约计算机的采购数量并且提高老师的培训工作效率;最终全省培训中心的网络化实训室联接互联网后,可以实现远程培训、远程鉴定等远程培训功能。  【关键词】电能计量实训室;网络一体化;培训
近日,生活在悉尼的吕蓓卡·豪依将自己的爱车改装成了可使用柴油与植物油的混合动力车。豪依认为,她的爱车——一款使用柴油的1986制造的丰田Land Cruiser,并不是很经济环保,
【摘 要】主要研究计算机网络管理与其相关安全技术,对网络安全的立法、管理、技术三方面内涵进行了正确理解,并总结了计算机网络管理工作的有效措施,并对网络常见安全技术进行了介绍。人们对网络的依赖程度越来越大,加强网络管理和安全技术的研究是保证网络安全的必要措施。  【关键词】计算机;网络管理;安全技术  信息技术和网络技术日新月异,改变了人们的生产生活方式,网络金融成为了经济发展新的热点,用户对网络的
为探究吕家坨井田地质构造格局,根据钻孔勘探资料,采用分形理论和趋势面分析方法,研究了井田7
据国外媒体报道,英国桑格研究所的科学家们首次在卵细胞表面发现控制受精的关键蛋白。这一发现很可能对女性不孕的治疗带来重大影响,而且有可能带来新的避孕药问世。英国桑格
据国外媒体报道,坎布里亚郡位于英国英格兰北部,这里不仅是一个人口大镇,同时也是一处神秘的核“废料”存储站,一些核工业使用过的放射性物质存储在这里的仓库中,但科学家们