【摘 要】
:
随着包括化学情报学、生物信息学、计算机视觉、视频索引、文本检索以及Web分析在内的广泛应用,图做为一种一般的数据结构在复杂结构和它们之间相互作用建模过程中变得越来越
论文部分内容阅读
随着包括化学情报学、生物信息学、计算机视觉、视频索引、文本检索以及Web分析在内的广泛应用,图做为一种一般的数据结构在复杂结构和它们之间相互作用建模过程中变得越来越重要。为了进一步进行特征化、区分、分类和聚类分析,挖掘频繁子图模式已经成为了一项重要的任务,频繁子图挖掘已经成为了数据挖掘中一个活跃和重要的课题。在各种各样的图模式中,频繁子结构是可以在图集合中发现的非常基本的模式。频繁子结构可以用来刻画图集合的特征,区分不同的图组群,对图进行分类和聚类,构造图索引和更方便的在图数据库中进行相似性搜索,例如,通过对比不同类中频繁图的支持度,发现HIV甄别数据集中活跃的化学结构。但是,现有频繁子图挖掘算法在最小支持度很低时效果并不好,因此,本文给出在集群并行环境下频繁图并行挖掘算法。本文主要的研究结果如下:根据频繁子图挖掘算法gSpan的算法思想,提出了一种在基于集群并行环境下的动态负载平衡的频繁子图并行挖掘算法。该方法通过划分DFS词典树,维护本地负载队列,限制负载粒度等策略有效的实现了并行频繁子图的挖掘,理论分析和实验结果验证本文的并行算法在集群机器上具有很好的性能。针对频繁闭图挖掘算法CloseGraph,给出了早期终止失败检测的替代方法,实现了CloseGraph算法,并且进一步提出了频繁闭图并行挖掘算法,并且实验验证了算法,算法具有较好的性能。
其他文献
多媒体技术的飞速发展和国际互联网的普及,给人们的学习和工作带来了极大的方便,人们可以通过网络进行信息交互,共享网络资源。互联网已成为人们离不开的信息工具。但是同时
虚拟专网(VPN)技术是指在公共网络中建立专用网络,将数据通过安全的“加密管道”在公共网络中传播,可以保证数据的安全传递。而且使用VPN技术组建网络有节省成本、提供远程访
近年来,随着H.264/MPEG-4 AVC、AVS等新一代视频编码标准的制定,视频编码技术正一步步走向成熟。帧内预测技术作为混合视频编码框架中的重要组成部分,对提高视频编码效率有重
随着计算机和网络技术的不断发展,在线学习越来越成为目前国内外的研究热点,近些年涌现了一大批在线学习的网站,如Coursera, Edx和Udacity,这些网站大多要求学习者通过观看视
IPv6也被称为下一代网际协议(Next Generation Internet Protocol,IPNG)。它是网络技术史上重要的升级之一。它将慢慢取代IPv4成为因特网络的基础设施,并且将对网络产生积极
数字音像内容集成管理平台(NNM管理系统)是基于C/S模式的、在内容运营商系统中实现对音像内容管理、查询和维护的平台。对于运营商来说,它是对分布式资源网络中所拥有的音像
目前我国正在处于信息化建设的时代,各部门和各单位都组建了各自的网络系统,这些网络主要包括无线传感器网、以太网、自组网等。然而这些异构网络系统种类繁多、接口各异,因
文景转换系统,主要分成三个模块:抽取自然语言脚本模块、自然语言脚本生成动画脚本模块、动画生成模块。本文是该项目从自然语言到动画的中间过渡模块。本文的研究任务是从自
网络的普及和发展给语言学习和语言测试提供了前所未有的机遇和发展空间。随着客观题测试技术的日趋完善,主观题的自动测评让语言测试者备感兴趣,同时也给语言测试带来了新的挑
游戏引擎的重要性越来越明显,在一个开发完成的引擎上只需要添加足够的游戏内容,游戏就可以短时间内运行起来。在3D游戏引擎中渲染引擎部分是最重要的,具有很强的重用性、独立性