利用MapReduce平台实现高效并行的频繁子图挖掘

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:huanan_0909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
频繁子图挖掘是数据挖掘领域的一个重要问题,并且有着广泛的应用。在Hadoop平台上实现了一种基于MapReduce的高效频繁子图挖掘算法Cloud-GFSG(cloud-global frequent subgraph)。该算法基于Apriori思想,在扩展边生成新的子图时,使用已经挖掘出的k-1阶的频繁子图生成k阶的频繁子图。同时,检查是否存在待扩展生成的子图,设定生成的频繁子图表示规则,保证了频繁子图信息的唯一性。较同类算法相比,该算法在挖掘频繁子图时更具通用性,并且在扩展边时避免产生大量的复制图,从
其他文献
软件体系结构提供了软件系统的高层抽象,对于软件密集型系统的开发具有重要意义,基于体系结构层次的可变性管理可以有效地实现软件的定制和演化。目前体系结构层次的可变性建模
针对传统基于主动学习的支持向量机(support vector machine,SVM)方法中所采用的欧式距离不能有效衡量高维样本之间的相关程度,导致学习器泛化能力下降的问题,提出了一种基于向量余弦的支持向量机主动学习(SVM active learning based on vector cosine)策略,称为COS_SVMactive方法。该方法通过在主动学习过程中引入向量余弦来度量训练集中
摘 要:支架式教学在高校足球教学中已经进行了长时间的探索与应用。通过实践和调查访问,我们看到了支架式教学在教学中的显著效果,也总结出了支架式教学应当注意的问题。并且在此基础上提出了支架式教学应该使用的评价体系,从学习动机、人际交往、足球考核成绩等多个方面加以测量和评定。经过实践证明,支架式教学模式在高校足球教学中起到的作用是十分明显的,对于培养学生能力、增进学习兴趣、促进人际交往能力具有积极的作用
目的 探讨Survivin蛋白在喉鳞状细胞癌、喉乳头状瘤及喉黏膜白斑中的表达及其意义。方法 应用免疫组化对46例喉鳞状细胞癌、24例癌旁组织、20例喉乳头状瘤、28例喉黏膜白斑和
正确建立软件文档与代码间的可追踪关系对程序理解、软件维护等非常重要。近年来,软件文档与代码间的可追踪性研究大多基于文本词汇相似度,没有充分利用软件文档和代码所蕴含的
Eiter等人为语义网提出的回答集程序和描述逻辑相结合的描述逻辑程序,获得了本体上的非单调表达和推理能力。王以松等人证明了描述逻辑程序的完备化和环公式可以精确刻画描述
蛋白质识别关键区域的研究对揭示生命现象的本质规律,提高药物设计效率,降低新药物开发的成本和周期有重大的应用价值。但由于蛋白质大分子结构的高度复杂性,一般的计算机系统难以对蛋白质识别过程中结构与功能的连续性变化实现快速动态分析。设计并实现了一种基于GPU/CPU异构的集群系统,根据生物计算的特点对异构集群进行数据结构和算法设计,建立起基于GPU的Kd-tree构造和访问的高效算法,以提高系统并行计算
患者,男,69岁,因前额部肿胀疼痛2个月人院。患者因前额部肿胀疼痛以口服抗生素治疗,效果不佳。入院前行颅脑CT平扫,见轻度脑萎缩,筛窦炎,左侧额窦见一囊肿样物。专科检查见前额部隆
目的分析支撑喉镜下喉内镜手术中并发症的病因及处理。方法总结分析2000年1月~2007年10月,我科住院的91位患者,全麻监视器下连接支撑喉镜与喉内镜,施行喉部微创手术出现并发症的
压缩技术被广泛应用于数据存储和传输中,然而由于其内在的串行特性,大多数已有的基于字典的压缩与解压缩算法被设计在CPU上串行执行。为了探究使用图形处理器(graphic processing unit,GPU)对压缩与解压缩过程潜在性能的提升,结合合并内存访问与并行组装的技术,基于CUDA(compute unified device architecture)平台研究了两种并行压缩与解压缩方法:基