【摘 要】
:
近年来,数据挖掘技术成为数据库和人工智能等领域研究的热点课题,不仅引起了学术界广泛关注,而且也引起了产业界的高度重视。频繁模式挖掘是数据挖掘中非常受关注的一个课题,
论文部分内容阅读
近年来,数据挖掘技术成为数据库和人工智能等领域研究的热点课题,不仅引起了学术界广泛关注,而且也引起了产业界的高度重视。频繁模式挖掘是数据挖掘中非常受关注的一个课题,已经有大量关于这个课题的文献被发表,不仅在数据挖掘领域取得了巨大的进步,而且数据管理的对象也从非结构化数据向结构化数据延伸。图数据结构作为模式一种特别形式,具有强大的表述能力,很多新兴的数据库都采用图数据结构建模。
随着频繁模式挖掘的深入研究,特别是图模型被越来越广泛地应用于为各种事务建模中,图挖掘的研究显得越来越重要。在图挖掘过程中子图同构是关键步骤,而对图集的一次分析后,怎样在后续的多次挖掘过程中充分利用分析的结果,又直接影响着子图挖掘的效率。本文介绍了子图挖掘的研究背景,国内外研究现状,并阐述了课题研究的意义和内容。详细介绍了图论的相关知识、子图挖掘研究中的基础知识,并分析了常用的技术思想及一些经典挖掘算法。
本文的研究针对非唯一标识的复杂有向连通图模型,并基于频繁模式树结构,改进了频繁模式增长算法,提出了CCFM算法来挖掘频繁连通闭合子图。文章最后通过采用生物分子结构数据集进行实验表明,CCFM算法能够高效地挖掘出有向连通图集中的频繁闭图集。算法生成了一个包含所有频繁度的闭频繁子图集的搜索路径图,并对这个搜索路径进行了优化,这个路径指导多对一子图同构的挖掘过程,可以提高子图同构的运行效率。
其他文献
古琴,是中华民族传统文化的瑰宝,更是世界人类文明的重要文化遗产。当前,随着信息科学与技术应用领域的不断深入,各学科领域的信息化、数字化工作正以前所未有之势开展,计算
人体运动捕捉是计算机视觉领域倍受关注的一个研究热点,在智能视频监控、视频分析、动画、游戏、医学诊断和人机交互等领域均有广阔的应用前景。它包括人体的标定与跟踪和人
检测技术及设备在工业、农业等领域应用非常广泛。面对高性能、便捷性等市场需求,系统架构是检测设备成败的关键因素。传统的检测平台或终端多采用以单片机或简易嵌入式微处理
随着生物数据的增长,利用计算机处理,分析和存储浩如烟海的生物数据已经成为一种趋势,从原始的序列分析逐渐发展到包含基因组学,基因表达研究学、和结构生物学的科学。MADS-box基
论文针对我国竹类种质资源基础数据不全面、不完整、信息分析处理和利用程度低,以及竹亚科属种分类存在争议的问题,开展竹类种质资源数据抽取与分类方法研究。研究以构建竹类
随着信息网络的迅速发展,越来越多的Web数据通过XML形式进行表达,XML的数据量呈指数级增长,由最初的MB发展到GB,以至TB。面对如此庞大的数据,信息的在线获取和查询变得越来越
伴随着计算机、图像处理、人工智能和模式识别等各项技术的迅速发展,近年来兴起了数字化视频监控的浪潮。利用计算机视觉和视频分析的方法对摄像机拍录的图像序列进行自动分
移动网络的提速、iOS的兴起和流媒体的崛起促成了移动流媒体的普及。由于移动网络具有移动性、分布不均、突发性、不确定性等特征,在该网络上传输实时流媒体数据时,如何降低
CT(Computed Tomography)技术自出现以来,以其所具备的高密度分别率、能够提供完整的三维信息、显示扫描断面角度多样化等优点,被广泛用在医学诊断、工业检测、安保检测、航
医学图像分析处理在临床诊断和治疗中起着越来越重要的作用。近年来,细胞活性分析成为该领域研究的重要课题。该课题主要研究内容是对显微图像进行分析,判断细胞活性,并进行