浅析数据挖掘技术的统计工作创新

来源 :大科技·D版 | 被引量 : 0次 | 上传用户:TNT2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:对于统计工作者们来说,高质量的统计数据以及将数据挖掘相关技术所具有的优势在统计工作当中充分发挥出来,就是现阶段所需要解决的重点问题。本文主要分析了数据挖掘技术在统计工作中的创新应用。
  关键词:数据挖掘技术;统计工作;创新
  中图分类号:TP311.13 文献标识码:A 文章编号:1004-7344(2018)24-0299-02
  1 引 言
  当前大数据、云计算以及物联网等这些先进的科学技术在人们的日常生活中发挥着越来越重要的作用,这些先進技术的应用在很大程度上加快了数据传播速度的同时还在一定程度上提高了信息传播的质量。在统计工作中,信息技术的不断应用可以让数据信息变得更加及时、完整与有效。统计部门以“用数据说话,为决策服务”为职责,其工作的质量与政府决策相关工作的有效性与合理性有着十分直接的联系。对于统计工作者们来说,如何让统计数据说明事物本质,以及发展规律,将数据挖掘相关技术所具有的优势在统计工作当中充分发挥出来,就是现阶段所需要解决的重点问题。本文主要分析了数据挖掘技术在统计工作中的创新应用。
  2 具体应用过程中数据挖掘技术与统计学方法的区别
  通常我们获取的大量原始资料都比较零星、分散,是不系统的,仅仅反映了事物的表面现象或一个侧面,在统计学方法上先进行数据统计整理,分组、汇总,再利用统计学方法进行统计分析,这样工作效率相对较低。引入数据挖掘技术,即使面临的数据信息比以往更大,也可提高数据处理效率。与统计方法相比,数据挖掘的优点表现在以下两方面:
  2.1 数据挖掘技术的智能化程度比较高
  随着大数据的发展,数据的生产者和提供者不再囿于政府统计系统,各种互联网、电子商务、搜索引擎等信息平台产生的图片、网页和音频视频等资料都能成为统计数据的来源。面对纷繁复杂的统计数据,对于统计学来说,其主要是通过建模的手法实现在大量数据中选择有效的数据信息;而数据挖掘技术则主要是为了发现更加有效、可以利用的数据。
  2.2 数据挖掘技术可以进一步促进统计学的发展
  当前,统计工作人员的主要任务是将数据信息建成模型,并对该模型进行深入的研究,对数据进行详细的分析。对于数据挖掘技术来说,其主要有以下几种类型:①决策树;②神经网络;③聚类分析等。在统计学中,数据挖掘技术的应用应以不同的需求为根据来选择,从而在最大限度上提高数据处理的有效性。因为数据挖掘技术具有处理数据量大、维数比较高、结构比较复杂以及种类多样化等优点,其应用可以在很大程度上加快统计学的发展,提高统计人员工作的质量以及工作效率。
  3 现阶段统计工作中数据处理方面存在的问题以及缺点
  3.1 缺乏统一的数据存储管理平台和手段
  近年来,统计系统先后建设了以普查、调查和常规统计为主的各类统计应用平台,但这些平台互相之间无数据交换共享。如:目前经常使用的一套表数据处理平台,主要按“五上”专业分布,和利时程序是投资数据处理平台,久其程序主要是农业数据处理平台。数据存储方式、存储格式及存储地呈现多、乱、散的特点,缺乏有效的、统一的存储管理平台和手段,不利于数据的交换共享和深层次的挖掘分析应用。
  3.2 缺少对于数据处理的统一管理标准
  由于统计数据处理平台多数只针对某项专业,统计人员必须熟悉各类应用平台处理的统计数据对象、范围、时效等标准,熟练掌握不同时期不同统计应用平台的操作,这样给统计数据的挖掘分析等深层次应用带来一定难度。由于缺少对于数据的统一管理标准使得无法更深入的研究数据。
  3.3 缺少对于数据处理的有效开发
  虽然统计部门获得的数据资源十分丰富,但是因为缺少挖掘数据的工具,因而不能对数据资源实现更深层次的分析与研究,所以造成了对数据资源的浪费。对于政府以及企业来说,在进行相关决策时主要根据就是获得的统计数据,因而需要进一步创新以及开发统计数据方面的工作,但是现阶段,统计相关工作尤其是基层大部分停留在数据的汇总阶段,并没有进行后续的相关开发工作。这种做法就使得数据资源不能够进行再次利用,在一定程度上降低了统计工作的工作质量以及工作效率,从而没有办法进一步的创新与开发统计工作。
  4 统计工作创新与以数据仓库为基础的数据挖掘技术结合
  为了能够有效的解决上述提到的数据统计中所存在的问题,可以应用到以数据仓库为基础的数据挖掘技术:
  (1)以数据仓库为基础的算法可以实现对于在挖掘数据过程中所存在的预处理数据耗费时间问题的有效解决,此外,对于处理数据过程中的抽取、清洗、转换以及装载等过程,可以通过数据仓库的建立而节省掉。
  (2)对于数据仓库来说,以主题组织为根据来存放数据,这一做法更方便挖掘出恰当的数据资源。对于获得的数据资源往往会因领域的不同而被分为国民经济行业统计数据、社会民生统计数据、部门数据、各类调查数据等。
  (3)从数据资源来看,统计部门只能看到数据处理平台建成至今数据,历史数据只能通过其它方式获取,也就导致有许多的知识如预测性应用等没有办法挖掘出来;相反的,数据仓库存管理数据则可以从PLTP系统、历史业务数据以及外部数据源中获取数据,并进一步对数据进行处理,从而最终实现对于获取数据的有效利用。除此之外,在对数据环境的要求方面上,数据挖掘需要以多维数据集的数据环境为基础才行,而数据仓库技术则完全能够满足数据挖掘技术的相关要求。所以说,将数据挖掘与数据仓库结合在一起,进行协同工作,数据挖掘技术可以成为应用数据仓库过程中非常重要的工具,除此之外,对于挖掘数据过程中的步骤可以进行一定程度的简化,提高处理数据的质量以及效率,让获取的数据资源更加广泛和完整。
  5 利用数据挖掘技术进行统计创新
  (1)形成统计大数据运行平台,建立起以企业一套表、普查数据、专项调查数据为基础,集统计数据采集、交换、处理、分析、服务、管理为一体,统一规范、大容量、可扩展的数据资源管理中心,为管理部门和社会公众提供准确、及时、全面的统计信息服务。
  (2)全面建成统计数据中心,形成以联网直报采集平台、数据交换平台、数据处理平台为核心的统计数据生产系统。
  (3)实现计算资源、网络资源、存储资源、安全资源和数据资源等基础设施的统一管理、资源共享与运维监控,为各类统计业务应用系统提供统一的基础设施支持和保障。
  (4)建立经济预测分析系统、经济动态跟踪监测预警系统。采用先进的统计分析和数据挖掘创新技术手段,对社会发展趋势进行短期和中长期的预测分析。
  6 结束语
  对于统计数据来说,因为其具有十分重要的作用,是政府以及企业进行决策的重要依据。但是现阶段统计工作中数据处理方面存在以下问题及缺点:缺乏统一的数据存储管理平台和手段;缺少对于数据处理的统一管理标准;缺少对于数据处理的有效开发。为了能够有效解决上述提到的问题,可以应用以数据仓库为基础的数据挖掘技术:①以数据仓库为基础的算法可以实现对于在挖掘数据过程中所存在的预处理数据耗费时间问题的有效解决;②对于数据仓库来说,以主题组织为根据来存放数据,这一做法更方便挖掘出恰当的数据资源;③对于采集到的数据资源,数据仓库技术则完全能够满足数据挖掘技术的相关要求,并简化挖掘数据过程中的步骤,提高处理数据的质量以及效率,让获取的数据资源更加广泛和完整。
  参考文献
  [1]王佳丽.浅谈数据挖掘对航空数据统计工作的创新[J].商,2015(35):207.
  [2]张振普.经济统计工作中数据挖掘技术的应用分析[J].中国电子商情:科技创新,2014(11):48.
  [3]刘秀华.浅谈数据挖掘技术在经济统计中的应用[J].商场现代化,2014(23):280~282.
  收稿日期:2018-7-25
  作者简介:杜 芝(1977-),汉族,陕西澄城人,中级统计师,大专,负责综合、GDP核算、非公核算、投入产出调查工作。
  杨 洁(1973-),汉族,陕西澄城人,中级统计师,大专,从事统计工作。
其他文献
城乡结合部作为连接城市与农村的中间地带,其发展凸显两面性:既有城市快速扩展带来的辐射效应,其发展潜力不可小觑;同时也无法逃避污染、破坏等发展中不可逃脱的发展“宿命”。生
针对石灰乳制备装置进行了一系列的改造,从石灰进入石灰储罐,到最终以石灰乳的形式进入球磨机,需要经过石灰罐下料闸板阀、石灰管下料口、螺旋输送机、螺旋输送机下料口、搅
学位
上世纪90年代到21世纪初,中国互联网经历了跨越式的发展,其所根植的政治基础、经济基础和社会基础也处在深刻的变革之中,它预示着数以亿万计的中国人的正在经历和期待的深刻变革
骨良性纤维组织细胞瘤临床罕见,主要采取手术治疗,常用术式为局部病灶刮除联合骨水泥填充或植骨术,根据病灶范围亦可行局部切除术,一般预后良好,复发率较低.该病术后继发色素
期刊
随着我国经济建设的稳步推进,居民生活水平逐步攀升,在解决温饱问题等低层次的生理需求以后,就出现更加多样化的需求,对于身体健康的追求就是其中的一种。当我国成为名符其实的“
小学美术教师在教学中应该注重美术与生活元素的联系,以此来发现小学生的美术天赋,并能在美术学习中感悟生活.探讨如何在教学中实现小学美术的生活化.