论文部分内容阅读
随着产业界数据量的爆炸式增长,大数据(Big Data)概念引发的热情也越来越高涨。产业界需求与关注点发生了重大转变:企业关注的重点转向数据,计算机行业正在转变为真正的信息行业,从追求计算速度转变为关注大数据处理能力,软件也将从数据采集与存储为主转变为以数据处理为中心。机器学习算法在学术界具有很高的学术研究价值,在产业界有很大的实用价值。由于大数据的海量、复杂多样、变化快的特性,对于大数据环境下的应用问题,传统的在小数据上的机器学习算法很多已经不再适用。因此,研究大数据环境下的机器学习算法成为学术界和产业界共同关注的话题。本文主要对当前用于处理大数据的机器学习算法的研究现状进行了分析和总结,此外,并行是处理大数据的主流方法,因此还单独对一些并行算法进行了介绍,并引出了大数据环境下机器学习研究所面临的问题,最后指出了大数据机器学习的研究趋势。