数学在大数据挖掘中的应用探究

来源 :读天下 | 被引量 : 0次 | 上传用户:skylong5257
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:大数据技术是互联网信息技术发展下重要的科技产物,大数据通过对不同领域的巨量数据进行统计,从而完成数据整合,形成数据分析。本文主要以大数据挖掘和处理当中所应用到的数学知识为出发点,对大数据技术当中常常运用的数学原理和数学知识进行整理,从而了解数学知识在现实生活当中的应用价值和主要运用方向。
  关键词:数学;大数据;数据挖掘;数据处理
  与一般的数据处理方式不同,大数据技术所进行的数据分析和数据挖掘当中的对象数据,通常是普通软件在一定的时间之内无法完成统计和整理的数据内容,大数据技术需要另辟蹊径,通过先进的处理模式,完成对于数据的分析,从而实现数据整合。因此在目前阶段,大数据技术具有5V特征,其中巨量、高速、多元、真实以及低价值密度等,是使其领先于其他数据技术的重点要素。
  一、 大数据挖掘过程中的数学原理
  在进行巨量数据的挖掘时,技术手段需要对庞大凌乱的数据信息进行整理和搜索,从而形成清楚、明确的数据信息类别,其中数学知识当中的聚类分析法,是大数据挖掘过程当中主要采取的挖掘策略。目前大數据技术主要采用灰色关联、目标函数模糊以及区间值算法来实现聚类分析的数据挖掘。
  (一) 灰色关联法的应用
  灰色关联主要用来对巨量数据当中各项因素之间所呈现出相同或相异的发展趋势、发展程度进行分析比较。在数学知识当中,灰色关联法可以对各项因素之间的关联程度进行归纳,从而了解因素的性质和发展特征。而在大数据挖掘当中,借助因素分析和总结,能够帮助大数据技术实现对于对象数据的动态观察,从而实现对数据发展历程的研究。数学知识在进行灰色关联表达时,通常借助影响因子集和因子间关联映射集来共同构成关联分析系统,表达式为S=(X,R),而在大数据技术当中,技术研究人员则通过对数学原理的开发,形成了基于集合的灰色管理法。灰色管理法是将数学表达当中的因子关系通过几何曲线的方式进行绘制,并根据绘制出的集合形状,开展对于对象数据的整合处理。在处理过程中,所完成绘制的几何曲线与几何形状的整体趋势越接近,表明数据信息之间的因子关联度就越高,二者之间表现为正相关关系。技术研究人员通过这一策略,能够有效地将数据当中残存的数据片段或者数据量较小的数据单元挖掘出来,从而获取其重要的价值信息。
  (二) 目标函数模糊法的应用
  在实际生活当中,运用模糊聚类方法这一数学知识进行应用和数据处理,主要集中在图片信息、计算机信息等处理领域,而随着技术的发展与进步,模糊聚类方法在一些复杂的数据挖掘当中,也得到了广泛的运用。其中借助目标函数来开展模糊聚类的信息处理方式,已经成为现阶段大数据挖掘技术当中的重点技术。众所周知,大数据挖掘所面对的巨量数据往往信息内容杂乱、信息处理难度高。而基于目标函数的模糊聚类技术则主要能够处理高纬度的信息内容,同时其所具有的伸缩性和高效率特征,也解决了以往困扰数据技术应用和创新领域多年的问题。在具体的应用环节当中,技术研究人员需要首先结合对象样本的数据内容设定目标函数,并借助目标函数的标准化来设定具体的科学指标,从而使数据内容可以整合到一个模糊的矩阵当中。模糊矩阵的处理方式主要为直接聚类以及模糊等价两种方式,两种方式所面对的是数据集整合目的和关键指标聚类的要求,因此技术研究人员可以依照编网法、最大树法,实现对于矩阵信息的提炼,完成聚类。
  (三) 区间值算法的运用
  区间值算法是聚类算法当中的一个重要的组成部分,在数学知识当中,区间值算法能够实现对于不完整的信息的整理和分析,从而实现信息提取完成聚类。大数据技术在进行数据挖掘时,同样会运用到区间值算法技术,通过对复杂的数据进行挖掘,并从中完成数据的转化,使数据能够具有比较性。在数据挖掘实践当中,区间值算法要求技术研究人员能够通过对数据范围进行固定取值的方式,实现对于数据的科学分析,其中数与区间聚类法,是将数理统计原理融入到区间值的而运算当中,帮助技术研究人员精准判断样本数据对象的挖掘区间,并确定数据之间的信息相互关系,从而完成区间值的确定,实现数据挖掘。
  二、 大数据处理技术中的数学原理
  在大数据挖掘的过程中,大数据技术还需要及时对所完成挖掘的数据信息内容进行处理。对于数据挖掘工作来说,数据处理技术应当具备极高的时效性,处理技术应当在一定的时间内完成处理任务,保证处理效果。通常情况下,受到原始数据的噪声干扰、数据指标集过于庞大,都可能造成数据处理的失败。因此在现代数据处理技术当中,技术研究人员通过数学知识的运用,来实现数据处理的准确性。通常情况下,为了保证数据处理不受到因素干扰,处理技术当中通常会采用数学知识中的统计学算法,将相关性分析作为基础,对数据进行分组,完成处理。相关性分析法还要求能够结合数据当中的数量变化规律,进行数学建模,并结合已知信息来推导出未知信息,从而实现对于已挖掘到的数据样本的校验和判断分析。
  三、 结论
  综上所述,在实际的大数据挖掘技术运用当中,有着大量的数学知识和数学原理得到了运用。大数据技术作为对于巨量数据进行整理和分析的技术,其势必要面临数据的趋势、数据的发展和信息的变化,而数学模型和数学统计在这些方面均具有极大的优势,可供大数据挖掘分析进行吸取和借鉴。
  参考文献:
  [1]李佐军.大数据时代下关联规则兴趣度挖掘在就业分析中的应用[J].软件工程,2018,21(11):25-27.
  [2]关雪峰,曾宇媚.时空大数据背景下并行数据处理分析挖掘的进展及趋势[J].地理科学进展,2018,37(10):1314-1327.
  作者简介:
  袁志康,重庆市,重庆南开中学。
其他文献
<正> 本厂生产的新型摩擦纺织机中的吹风管,是一个壁厚只有3mm的薄壁异形弯管铸件(见图1),材质为ZL104,并要求零件尺寸准确,内腔光洁。该铸件虽然尺寸不大,但铸造难度却不小,
提出并实现了一种紧凑型偏振光谱仪,该仪器采用光谱仪阵列,使测量光谱范围覆盖可见光波段;采用部分平行光路设计,简化了测量配置和系统校准方法;运用入射面旋转效应,实现了偏
进入二十一世纪以来,信息时代下全球一体化的快速进程为基于不同地域、文化、行业之间的跨界活动提供了强大的支持和可能性。在设计领域中,设计师们纷纷将跨界作为一种新锐的
<正> 在热处理生产中,不自觉地选错工艺方案与工装夹具,或局限于环境条件,或疏于不良操作习惯,均可犯下热处理大忌,从而造成工件的组织缺陷及其品质恶化,或者酿成安全事故,有
<正> 蠕虫状石墨铸铁,简称蠕墨铸铁。是一种新兴的工程材料。其石墨形态介于球状与片状之间,是一种过渡型石墨。在国外也有叫致密石墨、聚集片状石墨、厚片状石墨及珊瑚状石
如今,随着社会的发展和科技的进步,现代信息技术在各个学科中的应用已变得越来越广泛,其发挥的作用和价值也越来越明显和重要。以小学语文教学为例,并结合多年教学实践经验,对信息
为了对偏振热成像系统进行定标,设计了反射式红外可控部分偏振辐射源,从理论计算和实验测量两方面进行对比论证.首先,推导了铝反射镜的穆勒矩阵,提出了辐射源出射辐射偏振态
语文选修课的教学与必修课的教学最大的不同就是教师要引导学生带着一种鉴赏的眼光去欣赏文本。笔者在教学中为了让学生对姜夔的诗歌创作有更深入的理解,整理分析高中选修课文
<正> 我厂在生产化工设备中,要加工一批螺旋盘管,该批工件尺寸较大,生产批量小。在无专用弯管设备的条件下,我们利用普通卷板机和一副简易的模具进行弯制加工,获得了成功。 1
<正> 90&#176;弯板类钻模板,是JN1171系列黄河车架钻孔胎上的关键件,且用量大。过去在锻造此类锻件时,一直采用预锻成平板后直接压弯成形的工艺。此工艺虽较简单、但锻成的锻