大数据与大数据机器学习

来源 :河北大学学报(自然科学版) | 被引量 : 0次 | 上传用户:gaboo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代已经到来,大数据是指具有海量(Volume)、多样(Variety)、时效(Velocity)、不精确(Veracity)和价值(Value)这5种特征的数据,大数据研究是近几年信息处理领域最热门的研究方向,已经引起了工业界、学术界乃至政府部门的高度关注.大数据之所以备受关注,是因为大数据里面蕴藏着巨大的价值.如何把蕴藏在大数据中的价值挖掘出来,为企业或政府部门提供决策支持具有重要的意义.大数据给传统的机器学习带来了许多挑战,这些挑战可以从大数据的5个特征或从5个不同的角度进行分析.本文首先介绍大数据的概念,并详细剖析大数据5种特征的内涵;然后在此基础上,重点分析大数据给机器学习带来的挑战及可能的解决方法.本文对从事大数据研究的人员,特别是从事大数据机器学习研究的人员具有较高的参考价值.
其他文献
CCMT已成为机床行业最重要的展会之一,在机械工业下行的形势下,今年的展会规模及观众数量仍然稳步增长,让业内人士刮目相看。IMC集团总裁兼伊斯卡全球CEOIACOBHARPAZ先生亲临CCM
对来我院更换膀胱造瘘管的42名患者进行问卷调查,结果有95%的患者仍不能掌握好更换造瘘管和尿袋的间隔时间。并就膀胱冲洗、造瘘口的消毒、及日常生活等方面等提出了疑问。针
在1月举行的底特律车展上,大众汽车发表了针对TiguanGTEActive概念车的研究报告。欧瑞康巴尔查斯的ePD技术分别应用于此款车的外后视镜盖、前车灯架和散热器格栅。为车身的设
<正> 直大式窑是目前国内较广泛用于生产泡花碱的一种主要设备。我厂一台熔化率为1.2t/(m~2·d)的直大式窑,其燃油单耗为259.8kg/t,热效率仅24.38%。直大式窑的热效率偏低,其
因为主蒸汽管道运行的蒸汽高温高压的属性,在管道运行过程中,会产生较大的二次应力,又因为汽轮机要求的管口推力和力矩数值都较小,所以在应力计算的过程中为了降低设备的管口
阿西莫夫的《恐龙无处不有》和《被压扁的沙子》两篇文章要证明的论点都不过是一种假设,论证就是证明所提出论点的正确性,论证的过程则是不断假设和反复推论的过程。学习分析
工业和信息化部信息中心、中国互联网协会互联网工业应用委员会、中国互联网协会“互联网+”研究咨询中心联合开展了2016年中国“互联网+”在工业应用领域十大新锐案例的评选。
派翠西亚·里根的《地心营救》,是一部以叙事而非以视效取胜的优秀之作。电影取材于2010年发生在智利的著名矿难事件,在整部电影中,灾难是被表现的核心客体,但电影表现矿难发
在现代科学技术的众多领域,生产线的应用越来越广泛,掌握自动化生产线的核心技术,熟悉生产线的安装调试方法,是每一位机电类专业技术人员必须具备的基本能力之一。本文以甘肃
亚洲开发银行日前签署了价值总额高达4.5亿美元的贷款协议,帮助中国增加天然气在交通部门的使用比重,从而抑制快速增长的汽乍与内河船舶运输所产生的排放量。