描述性规则挖掘若干关键技术研究

来源 :东南大学 | 被引量 : 1次 | 上传用户:zjg760623
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
描述性规则挖掘是数据挖掘研究领域的重要课题之一。数据挖掘的任务是从大量的数据中发现模式,按照其功能作用可分为预测性和描述性挖掘,描述性规则挖掘对数据中存在的规律、规则做出一种描述,它涵盖了数据挖掘中关联分析、序列模式发现等重要研究领域。论文研究工作结合省知识产权平台建设工作,针对专利文献的挖掘和利用,在现有的描述性规则挖掘研究的基础上,针对描述性规则挖掘的实际需求和若干需要解决的关键技术,以关联规则分析为基础,对描述性规则挖掘中的序列模式挖掘技术、分布环境下关联规则快速挖掘技术以及基于关联分析的离群知识发现方法等进行研究。针对序列模式挖掘过程本身是一个反复的交互式过程,提出了一种基于PrefixSpan的快速交互式序列模式挖掘算法,当最小支持度发生变化时,算法能够充分利用前次或中间结果,快速生成新的模式;结合序列模式的增量式更新问题,提出了基于投影数据库的序列模式增量式更新算法ISPMP,算法采用间接拼接的方法更新已经得到的序列,用增量数据库来减小投影数据库,从而有效提高算法效率;在此基础上,为了进一步提高序列模式挖掘的效率,提出了一种基于二进制形式的候选频繁序列模式生成和相应的计算支持数方法,该方法只需对挖掘对象进行一些“或”、“与”、“异或”、等逻辑运算操作,显著降低了候选频繁序列模式生成和相应的支持数计算的实现难度,将该方法与序列模式挖掘及更新算法相结合,可以有效提高序列模式挖掘及更新算法的效率;针对大数据集关联规则发现问题,提出了一种快速挖掘全局最大频繁项目集算法FMGMFI,该算法采用FP-tree存储结构,由于FP-tree结构是一种压缩的存储结构,数据库中的记录可被压缩存储在建立的局部FP-tree的各路经中,使得FMGMFI可方便地从各局部FP-tree的相关路径中得到项目集的支持度,同时采用自顶向下和自底向上的双向搜索策略,可有效地降低网络通讯代价,高效地生成关联规则;最后,针对现有离群点检测算法多数面向低维空间数据,并且缺少语义解释的问题,结合关联分析及粗糙集知识提出了一种基于关联分析的离群点检测算法,算法可以有效发现存在于大量数据集中有别于正常关联模式的那些异常数据点。在论文的研究过程中,针对所提出各种算法进行了大量的实验验证,实验结果表明了算法的合理性和有效性。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
基于内容图象检索是计算机视觉、模式识别、数据库管理系统、人工智能及其它学科相结合的产物。在当今数字化社会中,图象数据急剧增长,远远超过了现有系统的检索能力,因此从大量
目的:分析补阳还五汤加减治疗慢性肾小球肾炎的临床效果。方法:选取我院2015-03~2017-01收治的慢性肾小球肾炎患者94例作为本次研究对象,随机分为观察组和对照组各47例,对照组
通过开展膜下滴灌甘草不同播期与种植密度的田间试验,结果表明,播期与种植密度对甘草生长性状和鲜根产量有明显影响,播种过早或过晚,不利于甘草出苗率的提高和合成物质的经济
沈阳化工集团作为国家512户和辽宁省60户重点企业之一,综合实力位居全国重点氯碱企业前列。其公司的财务状况状是众人所关心的重点,在老工业基地的沈阳市建立的化工企业,是于
2004年诺贝尔文学奖得主被公布后,艾尔弗里德·耶利内克在维也纳召开记者发布会,正式宣布她不会去斯德哥尔摩领取诺贝尔文学奖:“我不会去斯德哥尔摩接受该项大奖。”
全局光照明效果为用户提供了虚拟场景中的物体形状、材质以及相互位置关系的重要信息,从而能够大大提高计算机生成图像的真实感。尽管在很多交互应用中都需要全局光照明效果,但
微球的种类很多.当你看到这些微球时,恐怕不会把它们叫作球,只会把它们称为小颗粒。但它们却是货真价实的球体,因为太小了,直径只有1/20毫米左右,所以看起来就像是一粒粒灰尘