数据挖掘过程在R环境下的应用

来源 :第一届中国R语言会议 | 被引量 : 0次 | 上传用户:Matousec
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  数据挖掘是指“从数据中提取出隐含的特别的,过去未知的,潜在有价值的信息”[5]的一门学科。它可能涉及到数据仓储(数据库)、机器学习和人工智能、统计学、高水平计算、并行计算、数据可视化等多项技术。而R作为一种高度灵活的统计分析、绘图软件,不但拥有庞大的、持续更新的包(包括贝叶斯推断、分类方法、计量经济学、牛态学、金融学、遗传学、机器学习、稳健统计、空问统计、牛存分析、时问序列等多个方面)来扩展其数据分析方法,而且还有着便捷的接口来调用数据库,这些都为R作为数据挖掘平台提供了基本技术保障。本文从实际应用角度介绍了R语言在数据挖掘方面的优势,并举例说明了R在数据挖掘流程中的各项技术。
其他文献
会议
一、CDMA系统结构 CDMA数字蜂窝移动通信系统的结构如图1所示: CDMA 数字蜂窝移动通信系统主要由交换子系统和基站子系统两大部分组成。连接两大子系统的接口(也就是连接BSC和MSC的接口)称之为A接口,A
  贝叶斯统计的思想可以上溯到贝叶斯,远远早于频率学派;但是叭叶斯统计在相当长的时问内并未被大家接受。即使接受了贝叶斯的思想,在实际中贝叶斯方法受到计算能力的极大限
  本文对R的历史,体系结构,以及当前中国现状进行一个简要的概述。
展览名称:游光霖摄影展主办单位:全国美术馆专业委员会、福建省美术馆展览时间:2013年7月19日至8月2日展览展厅:中国美术馆7号厅展品数量:50件游光霖:1954年2月出生,1973年底
香叶天竺葵嫩叶,经灭菌消毒,置于MS培养基中,另添加NAA和6-BA适量,进行暗培养,室温30℃,接种后9天,即有愈伤组织发生。以后在人工光照下培养,每天照光11小时,光照强度2,000勒
在国外,海带备受青睐。朝鲜妇女把海带作为生育期间的主要滋补品;日本人把它作为健美的主要食品;俄罗斯人把它作为食物构成的重头菜。在我国,众食家对其有“食海带,等于吃了
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
会议
在非洲紫罗兰的离体培养中,以幼嫩的叶片、叶柄为外植体。在附加KT0.5~2ppm+NAA0.1~0.5ppm;BA0.5~2ppm+NAA0.1~0.5ppm的MS培养基上,均能分化出大量幼芽。前者是直接诱导根状物继