基于星型模型的NBA球队数据挖掘应用研究

被引量 : 0次 | 上传用户:li452546674
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实际的商业数据存在着关系的繁杂性、数据的海量性、脏数据的不确定性,关系数据模型会造成数据分析的性能及灵活性降低,如何选择满足数据分析高效查询性能的数据源结构是一个不可或缺的议题,从这一点出发,本文提出对于普通关系型数据转化为面向业务主题的星型数据建模方法和对此类数据的分析处理方案。本文基于NBA球队数据进行星型数据结构的建模及其分析研究,选择ECLIPSE、MYSQL5.1和MatLab2009为开发环境,对球队技术数据的聚类研究、球队球员数据的归类预判,得出多主题的星型结构在实际数据处理中的优越性和此类模型的分析方案。其中以球员球队两主题的星型模型为主要研究对象,将经过系统分析后抽象出来的概念模型转化为物理模型,形成现实数据库,并对已存在的CSV文本数据在MYSQL中进行相关的入库和ETL操作。使用MatLab2009的相关聚类函数进行数据分析,并对分析结果进行关联分析。采用判定树规则对归类变更后的预测或新增数据的分类分析。实现了球员球队文本数据的星型数据模型转换操作及入库和分析流程。通过对球员球队数据处理及分析的研究,面向业务主题的星型建模方法在数据的挖掘分析源处理上有着良好的性能优势,本文为挖掘分析提供了有利数据源结构的星型结构数据化方案,为其研究和相关分析提供了优良的数据源及分析方法。
其他文献
汉语成语形式精炼简洁,内容丰富,是汉文化的重要载体,也是重要的语言材料。本文把汉语成语的本体研究和教学研究紧密结合起来,运用语言学、文化学、教学论及二语习得的相关理论,先
农业科技信息传播是解决我国“三农”问题的关键之一。在资源有限的条件下,技术与信息成为农业发展的主导因素,现代化农业的发展,需要在农民与专家、农民与市场、农民与政府
高中数学课程改革是在剖析我国数学教育发展的历史与现状的基础上,综合世界各国课程改革的成果,进行的有益探索。改革的宗旨是力求减轻学生负担、提高学习兴趣、改善教学方式,但
本文以医院从事的知识管理活动为背景,系统地对知识流的建模方法、诊疗知识的需求表示模型、知识迁移控制与集成情景感知获取策略等问题进行了一一分析、研究和阐述;并结合实际
在中国改革开放和现代化建设的伟大实践中,以邓小平、江泽民、胡锦涛为代表的中国共产党人,结合时代特征和具体实际,对中国特色社会主义人力资本理论进行了系统探索。中国特色社
介绍了聚乳酸(PLA)聚合物和纤维的性质,以及根据PLA性质开发的新型复合纤维材料及其在纺织上的应用.
<正> 高速冷冻离心机是医学临床分析中不可缺少的设备,它的制冷系统一般均有四大关键部件,即压缩机、冷凝器、节流装置和蒸发器。国产离心机中制冷系统的节流装置均采用热力
计算机技术的不断发展,已经深入到人们生活、工作、学习的各个领域,特别是在生产、控制、管理系统中,计算机自动控制系统为工作带来了极大的方便。传统的计算机控制系统十分
大学生和谐人际关系的构建是大学生心理和身体各方面全面发展的基础和重要内容,同时也是促进大学生更好融入社会的关键因素。通过对大学生和谐人际关系的基本特征以及如何更