论文部分内容阅读
数据挖掘是指“从数据中提取出隐含的特别的,过去未知的,潜在有价值的信息”[5]的一门学科。它可能涉及到数据仓储(数据库)、机器学习和人工智能、统计学、高水平计算、并行计算、数据可视化等多项技术。而R作为一种高度灵活的统计分析、绘图软件,不但拥有庞大的、持续更新的包(包括贝叶斯推断、分类方法、计量经济学、牛态学、金融学、遗传学、机器学习、稳健统计、空问统计、牛存分析、时问序列等多个方面)来扩展其数据分析方法,而且还有着便捷的接口来调用数据库,这些都为R作为数据挖掘平台提供了基本技术保障。本文从实际应用角度介绍了R语言在数据挖掘方面的优势,并举例说明了R在数据挖掘流程中的各项技术。