频繁特征挖掘的优化与改进关联分类方法的研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:jie_169
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统关联分类算法中,庞大数据量增长下的规则更新不易、规则冗余需要优化提取等问题,本文提出基于贝叶斯分布动态更新规则与遗传算法选优规则的改进关联分类算法。主要研究如下几点:1、以项变量分布特征为研究基础,把基于频率计算的关联分类频繁集挖掘,转为基于分布下的概率计算与比较问题研究,把关联分类规则更新问题,转为在新增样本数据下,获取项变量贝叶斯分布的频繁集挖掘与规则更新问题研究,以项变量分布参数的先验分布与新增数据的样本分布,动态获取项变量分布参数的后验分布,以后验分布支持频繁集挖掘与规则更新,使频繁集与规则挖掘具有简便、动态和信息表示的多样性。2、对于提取的带有随机不确定性的关联分类规则,研究规则的优选:通过把规则转换为多个前提与结论的随机可能性表示的向量样本形式,进行K-均值聚类,以遗传算法优化聚类数和聚类结果,挑选最优聚类中心,并转换为具有代表性的最优规则,达到关联分类规则的选优。规则选优结果,以检验子集支持验证,遗传优化关联规则过程以Matlab语言自编程实现。3、将本文提出的基于分布的频繁特征挖掘、贝叶斯分布动态更新规则、遗传优化关联规则的方法,应用于高校资产效率管理项目,得到满意的结果,论证了本文方法改进与应用的可行性和有效性。
其他文献
自然坡面、人工边坡及滑坡、崩塌地带等坡面区域,均存在着大量的安全隐患,每年都会造成较大的社会经济损失以及人员伤亡,严重地影响人员的安全,而对其有选择地实施长期的周期性观测是未来排除坡面区域安全隐患行之有效的手段,利用无人机航摄技术进行坡面数据采集是准确掌握坡面区域地表位移等基本信息的重要技术手段,是实施坡面灾害防治的基础依据。但坡面区域作为特殊的高度差较大的地形区域,常用的航线规划方法存在很大的局
质子转移是化学反应中最基本的反应。这种反应多发生在氢键体系,当体系中质子供体和受体相互靠近时,分子内或分子间的氢键强度会变强,此时对其施加外界作用,就有可能打破氢键
黄土作为典型的湿陷性土,结构是影响其宏观力学特性的主要因素。然而,结构是一个很难定义的参数,为了避开这个问题,国内外学者们将研究视角限制在宏观结构上,将黄土视为一个均质连续的材料;岩土工程师们则只关注与工程直接相关的参数,如抗剪强度、变形模量等。这种宏观层面上的研究,能解决工程实际问题,但要解释一些复杂的机理问题,是无法绕开微观研究的。关于微观结构的研究,前人做了很多探索,也取得了一些显著的成果。
纤维堆囊菌(Sorangium cellulosum)可以在只含有结晶纤维素滤纸的无机盐培养基中生长,或者以木聚糖为唯一碳源培养基中生长。S.cellulosum So0157-2是本实验室分离得到的产埃
独立子空间分析(IndependentSubspaceAnalysis,ISA)具有非常有效的非线性特征提取能力,在人脸识别,图像分割,图像理解和图像聚类等方面得到广泛的应用。在这些实际应用中,关
我们通过在节点间建立成对纠缠态,构造了一个量子无标度网络模型。对量子无标度网络模型分别进行两类量子操作:通过局域化纠缠交换的方式对网络中的节点进行随机攻击,以及等
高科技企业创新生态系统是以客户需求为导向,以“协作R&D、知识产权许可、技术标准合作”为核心的技术标准化战略为纽带,由高科技企业在全球范围内形成的基于构件/模块的知识异
人体行为识别是目前从海量的视频数据中获取、处理与分析信息的一个重要的手段。由于复杂环境容易导致背景冗余轨迹的误提取,能否从全信息记录的稠密轨迹中准确提取描述前景
拟v-函数作为经典模形式的一类推广,自Ramanujan于1920年提出其概念以来,受到了广泛的关注与研究,并在现代数学中扮演越来越重要的角色。本论文是S.Zwegers关于拟v-函数理论
爆发式同步现象指的是复杂网络上的振子,随着耦合强度的增加,从混乱状态开始,经历一个不连续的、伴随着磁滞区的一级相变,变化到同步状态的过程。自2011年西班牙小组发表了 K