基于数据仓库的足球彩票分析系统的应用研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:luckmax1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会,面对“信息爆炸”的挑战,数据仓库和数据挖掘技术应运而生,并得以迅速发展,越来越显示出其强大的生命力。目前,数据挖掘技术已经在如市场分析和预测、生产过程优化、气象预报等分析与预测方面取得了一定的成功,但尚未涉及到彩票行业的分析与预测。针对以上空白,本文将新兴的数据挖掘技术与国内新兴的彩票行业相结合,让最新技术在最新的行业中发挥作用,这是本文的创新点之一。  本文首先分析了足球彩票行业的领域现状,然后对数据仓库与数据挖掘技术进行了系统地说明,接着按照数据仓库的设计过程建立了足球彩票数据仓库。在建立数据仓库之后,又对传统的数据挖掘算法Apriori算法进行了改进,提出了Improve算法。该算法首先要将数据预处理,用于生成频繁1项集并保留其相关数据,之后检验1项集数量是否足够进行2项集挖掘;然后进行大循环,不断由k项集挖掘k+1项集,并产生k+1项集的规则。在这个过程中进行剪枝,找出并删除那些不可能生成更高维频繁项集的频繁项集;返回值R为所有规则集。改进的算法相对原有的算法除了具有效率、预测的准确度上的优势外,还具有方便拓展、有利集成、适用于并行计算等特点,这是本文的创新点之二。随后,在从挖掘效率和挖掘准确率两方面对Improve算法进行实验分析并证明其先进性后,又对今后的研究工作提出了新的要求。虽然该系统是模拟性质的,但它仍不失具有实际的指导意义和应用价值。
其他文献
本文的工作来自高速文档扫描的项目.针对扫描电子文档平台的项目要求,本文从设计、结构和功能三个方面对软件的开放性进行了理解和阐述.设计的开放性、结构的开放性和功能的
为了提高k平均分区算法和层次凝聚算法的数据挖掘质量和执行效率,本文在综合分析k平均分区算法和层次凝聚算法各自优缺点和借鉴前人的算法改进方法的基础上,得出了一种速度更
自相关函数具有降噪特性,同时不改变信号的周期特性,理论上能提取出周期信号,但在实际应用中并不尽然.在故障发生的初期阶段,微弱的周期性故障信号往往被淹没在强度较大的背
每个有限状态自动机都等价于一个确定的有限自动机,但并非每个加权有限自动机都等价于一个子序列加权有限自动机。因此,确定一个加权有限自动机是否等价于一个子序列加权有限
该文研究工作是国家重点基础研究发展规划项目“网络环境下海量信息组织与处理的理论与方法研究”的一部分;研究对象是Web这样的动态海量信息载体;研究的主要目标是要得到一
本文主要研究模块化组合分类器以解决大规模学习问题.模块化组合分类器的核心思想是,先对各个子分类器进行模块化处理,然后将它们的输出进行组合并给出最终决策.该分类器需要
工作流技术作为一种实现企业过程集成的有效手段,正被越来越多的行业所关注,成为企业业务过程建模、业务过程仿真分析、业务过程优化、业务过程管理与集成,从而最终实现业务
本文在分析软件过程、软件评价标准、敏捷思想和价值观的基础上,结合我国软件企业的特点,以RUP为框架,提出了敏捷统一过程.敏捷统一过程是以架构为中心、迭代和增量的过程,它
Freenet以建立一个与现行“万维网”并行的自由网系统为目的,涉及到了网络框架、互连技术、信息安全甚至法律等各个层面。随着它的快速发展,其安全问题越来越突出。如何实现对F
学位
本文在公共入侵检测框架(CIDF)和Jpcap软件包的基础上,提出了基于神经网络的网络入侵检测系统模型,并从多个角度对该模型各个模块的功能、关系和实现机制进行了探讨.文中使用