【摘 要】
:
关联规则是最常见的知识表示方法之一,关联规则挖掘技术应用于档案管理信息系统中可以发现档案利用者使用档案的规律,以便提供主动服务,保护档案实体安全;发现师资队伍的学缘
论文部分内容阅读
关联规则是最常见的知识表示方法之一,关联规则挖掘技术应用于档案管理信息系统中可以发现档案利用者使用档案的规律,以便提供主动服务,保护档案实体安全;发现师资队伍的学缘结构、年龄结构、职称结构是否合理及人才流动原因等,为领导部门制定相关管理政策提供辅助支持,从而极大地提升我国档案信息化管理工作的层次和效率。但目前存在的关联规则算法,或需多次扫描数据库,或产生的候选项集数量巨大,或没有考虑事务间的相关性,而这些相关性在档案数据库中是普遍存在的,因此,这些算法应用于档案数据挖掘效率较低。如何改进现有的关联规则算法,从而可以在档案管理信息系统中推广应用成为目前研究的一个热点问题。为此,本文提出了基于等价类的关联规则挖掘矩阵算法(Association Mining Matrix Algorithm Based on Equivalence Class,以下简称EC-AMMA算法),该算法用数据矩阵存储事务集,只需扫描数据库一次,采用等价类划分来约简事务集,并且运算过程中不产生候选项集。由于最大频繁项集隐含了所有的频繁项集,所以EC-AMMA算法通过求取最大频繁项集来挖掘关联规则,算法把扫描数据库得到的数据转换成布尔数据后,用布尔数据矩阵存贮,矩阵的行表示事务,列表示事务中可能出现的项目,算法充分考虑到事务之间的相关性,采用等价划分的思想,对数据矩阵进行等价类划分,然后利用矩阵中各行的等价关系和频繁项集性质对数据矩阵从行和列两个方向进行约简,最后对约简后的数据矩阵自左向右扫描,利用本文提出的项目相似度在不产生候选项集的情况下,直接求取所有的最大频繁项集,进而求得关联规则。实验证明当频繁项集的维数K大于24时效率比Apriori算法有显著的提高,当K大于28时算法的执行效率则比Apriori算法高出5倍以上,且K越大优势越明显。我们把研究成果初步应用于人事档案管理信息系统中,在对教科研人员基本信息及其流动信息挖掘等方面,取得了较理想的效果。本文的主要贡献如下:1)采用等价划分的思想进行事务集约简。2)提出项目相似度的概念,利用项目相似度在不产生候选项集的情况下直接求取最大频繁项集。3)将EC-AMMA算法应用于档案数据挖掘并取得了较理想的效果。
其他文献
粗糙集理论是有效地处理不完备、不确定性数据的一种数学工具,被广泛地应用在人工智能和数据挖掘等领域.粗糙集与其他理论的结合.既有重要的理论意义.又有明显的现实意义.作
摘要:广州地铁二号线旧线因运营时间较长,在检修工程中,发现道岔转辙部分存在螺栓失效,岔枕(混凝土短轨枕)不平顺的病害,需进行综合整治。 关键词:岔枕打磨螺栓失效三综合整治 Abstract: guangzhou metro line 2 at old line for operation time is longer, in maintenance engineering, found tha
[摘要]针对本地区石料资源丰富,当地通常道路设计为水泥砼道路,但因交通量增大和各种施工因素的影响造成对路面的损坏,对水泥砼路面板病害存在成因谈防治的对策 [关健词] 水泥砼路面板、病害、防治 [abstract] according to the region stone is rich in resources, local usually road design for cement c
本文研究解变分不等式问题的同伦方法.我们对箱式约束、球约束、一般抽象约束集上的变分不等式问题从其等价的非光滑方程出发,利用它们的光滑逼近构造同伦,并在与已有的从K-K-T
摘要:本文论述了水泥砼路面常见的病害与产生的原因,对过去已修建的水泥砼路面过早出现的啃边、裂缝、断角、断板、等病害,严重影响着水泥砼路面的使用质量和使用期,同时给国家的投资也造成很大浪费,然而发现这些病害出现其中有相当一部分原因与施工方法有关。本文结合自己的施工实践重点从施工方面来研究病害产生的原因,找出改进施工工艺技术措施。 主题词:水泥砼 路面 病害防治 建议 Abstract: this
随着现代信息社会对通信业务要求的不断增长,图像通信与通信容量的矛盾日益尖锐,庞大的图像如果不进行压缩很难在网路上传播。图像压缩效率越来越受到人们的关注。目前图像压
摘要:随着运输的发展与进口贸易的增加,高速铁路客专四电集成进口物资价款支付流程越来越受到人们的重视。高铁是我国新兴的运输方式,中国正处在新一轮的进出口贸易大发展时期,各项新的进口政策不断出台,原有支付流程不断收到冲击。高铁客专四电集成进口物资价款支付流程对我国进口贸易带来了越来越大的影响,同时也对相关工作提出了更高的要求。笔者按照自身学习观察,分析了该支付流程使用中的问题,并提出了完善对策。 关