【摘 要】
:
将数据挖掘技术用于国家职业技能鉴定考务管理是一项有意义的工作。它有助于解决传统的数据分析技术所不能解决的问题,比如找出数据中潜在的模型、模式或相互间的关系等,从而揭
论文部分内容阅读
将数据挖掘技术用于国家职业技能鉴定考务管理是一项有意义的工作。它有助于解决传统的数据分析技术所不能解决的问题,比如找出数据中潜在的模型、模式或相互间的关系等,从而揭示已有的事实,预测未知的结果,进一步提高我们分析数据的能力。近年来这一技术发展迅速,在数据清洗、数据挖掘的方法论和挖掘的算法等方面都有长足的进步,相关标准也在形成和完善过程中,应用领域不断拓展,挖掘工具不断涌现,这为我们的应用奠定了基础。在研究上述技术的基础上,本文提出分两个层次自底向上分步实施逐步推广的建设考务管理数据挖掘系统的方案,在部鉴定中心建立数据仓库系统,在省、地市鉴定中心建立数据集市,数据的一致性和转换规则由元数据进行控制和保证,这两个层次都具备OLAP和数据挖掘功能。实际系统的建设采用SQL Server Analysis Services来完成。在建设过程中充分考虑了数据清洗和数据转换的重要性,采用列属性分析的方法用存储过程对空缺值、冗余数据和孤立点进行了处理,并去掉了与挖掘主题无关的属性。对于OLAP,关键是多维数据模型的建立,采用星型结构可以获得较好的性能。在设计事实表时考虑了数据简练的问题,在设计维表时进行了概念分层。对于数据挖掘,支持决策树和聚类两种分析模型。针对SQL Server Analysis Services平台依赖性、数据库依赖性和挖掘方法的局限性,提出了OSAM-DM数据挖掘引擎的设计方案。方案采用Java语言进行编程,遵循相关的数据挖掘标准,支持多数据源、跨平台,有良好的可扩展性,并完成了Apriori算法的实现。通过对样本数据的运行结果分析,效果是令人满意的,预示着系统良好的应用前景。
其他文献
数据分类是数据挖掘和机器学习的基本任务,已经在众多应用领域里取得了巨大进步。分类的目的是:分析输入数据,通过在训练集中的数据表现出来的特性,为每一个类找到一种准确的
近年来,随着因特网的崛起和语音技术的发展,VoIP已经占有相当比重的市场份额,成为当今电信业和计算机业最热门的话题之一。由于传统的PSTN用户仍然很多,VoIP发展面临的一个重
物流产业的迅速发展,使得第四方物流系统不断发展与成熟。随着物流服务资源的不断增长,如何能够快速而有效地获取符合用户意图的服务资源,给出合理的资源推荐与服务优化,成为了一
近几年,由于多媒体技术的飞速发展,数字图像已逐渐取代传统图像经成为当今世界视觉信息领域内图像的主要载体。因此,如何更加合理的运用海量的数字图像为用户提供所需信息成
当今时代,随着各个领域信息量呈爆炸式的速度增长,用于存储和管理信息的数据库系统面临着巨大的挑战,将数据压缩与数据库管理系统相结合的压缩数据库技术也就应运而生。对压
电大尺寸电磁环境信道评估为电磁环境评估中的一项重要研究内容。本文对该研究领域中电大尺寸的复杂场景电磁波传播路径查找问题进行了研究,由于目前光线跟踪方法的大量不足,本文将基于K-d树光柱跟踪算法应用到电磁散射路径查找上,并开发了相关系统平台。本文所采用的方法在数据结构上采用K-d树作为空间数据的组织方式,改进了原有光柱跟踪的遍历与求交,针对一些光柱遍历求交的特殊情况进行了处理。同时采用了一些图形学中
传统防火墙部署在网络边界,依赖网络的物理拓扑结构来保护内网的安全。但随着因特网的发展,网络拓扑结构越来越复杂,以及加密通信的出现和远程接入访问的需要,传统边界防火墙
随着数字图书馆中文献资源规模的激增,有效的描述、组织、管理和查找(检索或浏览)用户需要的文献资源正面临着严峻挑战。当前数字图书馆中对文献资源的元数据描述缺乏足够的语
传统的数字图书馆由于文献资源缺乏语义描述以及查询缺乏语义支持,其信息检索性能难以满足用户需求。下一代基于本体元数据的语义数字图书馆可提供文献资源的语义搜索,提高信息
应用自适应遗传算法解决QoS组播路由是近几年发展起来的一个热门课题。自适应遗传算法具有高度并行、随机和自适应等特性,但是,该算法具有以下缺陷:(1)容易陷入局部最优解,出现早