关联规则算法及其在个性化网站的应用研究

来源 :河海大学 | 被引量 : 0次 | 上传用户:anjo888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘就是从大量数据中提取和挖掘知识,故又称为数据库知识发现。关联分析发现关联规则是数据挖掘中最活跃的领域。在很多情况下,用户关心的只是关联规则的一个子集,因此科研人员引入了约束关联规则的概念。本文对关联规则和约束关联规则挖掘算法进行了研究和分析,发现基于候选集的约束算法仍有很大的缺陷,主要问题是: 1.需要反复扫描数据库 2.产生大量的候选集 因此基于候选集的约束算法在挖掘低支持度、长模式的规则时效率低下。本文分析了这些算法,提出了基于H-Mine算法的Con-H-Mine项目约束算法(Constraint-based Hyper-Structure Mining),该算法仅需扫描两遍数据库,并且采用模式增长的方法不产生候选集;采用Con-H-Struct(Constraint-based Hyper-Structure)结构存储数据集合,减少了空间的开销。同时该算法也可以适用于大型数据集,在进行数据集划分时能够有效地进行空间度量。 通过以上改进,设计出一个较好的、有效的数据挖掘算法,效率有所提高,优化了关联规则的挖掘。并以此算法为基础设计出一个个性化网站的原型系统并验证了可行性。
其他文献
目的 观察心肌梗死后新检测出糖代谢异常与患者预后的相关关系.方法 106例既往无糖尿病病史,入院血糖<11.1 mmol/L的心肌梗死的患者行口服葡萄糖耐量实验(OGTT),平均随访6个月观察患者主要心血管事件(心血管病因死亡,非致命性再梗,脑卒中以及严重心力衰竭)的发生率.结果 42例(39.6%)患者糖耐量正常,64例(60.4%)患者糖耐量异常.期间有6例患者因心血管病因死亡,均为糖耐量异常
目的 探讨淋巴细胞功能相关抗原-1(LFA-1)的崃碈D11a在急性淋巴细胞性白血病(ALL)的表达情况及其临床意义.方法 采用免疫酶标ABC法检测20例初治ALL患者和8例正常对照骨髓单个核细胞CD11a的表达.结果 CD11a在ALL患者骨髓单个核细胞的表达率(35.23±13.57)%明显低于对照组(87.13±5.38)%(P<0.05),治疗后完全缓解组的表达率(44.64±10.15)
目的 了解细菌性阴道病(BV)患者其它性病病原体混合感染情况.方法 对156例BV患者分别进行淋球菌(NG)、沙眼衣原体(Ct)、解脲支原体(Uu)、人型支原体(Mh)、滴虫(TV)和霉菌(Cd)检测.结果 156例BV患者中混合感染其它性病病原体的患者111例,混合感染率71.15%;其中混合感染Uu的患者41例(26.28%),居于首位,其次为TV 23例(14.74%).结论 BV患者混合感
目的 了解基质金属蛋白酶-2(MMP-2)及其组织型抑制因子-2(TIMP-2)在肝细胞癌(HCC)患者肝组织中的表达及分布状态,进一步探讨HCC浸润转移的发生机制.方法 采用免疫组织化学方法检测25例HCC患者肝组织中MMP-2蛋白和TIMP-2蛋白的表达及分布状态,结合门静脉癌栓的形成情况,进行定位及半定量研究.结果 有癌栓组MMP-2蛋白的表达显著高于无癌栓组,而TIMP-2蛋白的表达在2组
目的 分析医院儿科病房下呼吸道感染病人的致病菌及其耐药情况,为临床合理用药提供依据.方法 对儿科病房送检痰标本检验及细菌耐药结果分析.结果 在2 958份痰标本中,共分离细菌1 020株.其中革兰阴性菌948株,主要为肺炎克雷伯菌(404株)和大肠埃希菌(324株),二者均产超广谱-内酰胺酶;革兰阳性菌72株,主要为金黄色葡萄球菌(31株).大部分抗生素均对致病菌产生耐药性.结论 本院儿科下呼吸道
目的 评价紫杉醇联合诺维本治疗乳腺癌术后转移的临床疗效和毒副反应.方法 对22例经病理学和细胞学证实或影像学证实的转移性乳腺癌患者应用紫杉醇与诺维本联合治疗,28 d为1个周期,完成2~4个周期后评价疗效.结果 总有效率(RR)为54.5%(12/22);中位缓解期5个月(4~26个月).主要毒副反应为骨髓抑制、脱发和周围静脉炎.结论 紫杉醇联合诺维本治疗乳腺癌术后转移有很好的疗效,且毒副反应患者
计算机辅助诊断(CAD)在临床医疗诊断中已日益引起关注和重视,它主要是医生利用计算机对患者的医学影像信息进行图像处理和图像分析,检出病变并鉴别病变性质,同时与患者的综合病理资料进行匹配、对比,然后作出智能诊断的软件系统,其结果作为"第二个意见"供诊断医师参考.目的是使医生的诊断过程更客观和容易,提高诊断效率,与计算机的"自动诊断"是完全不同的概念[1]。
卫星通信是现代通信技术之一,卫星移动通信是实现全球个人通信的必然组成部分,而多媒体卫星移动通信是当前卫星通信界的研究热点之一.该文根据移动多媒体卫星移动通信系统的
  本文计算了碘分子在532nm波段的吸收谱线的强度、跃迁分支确认;并开发了该计算软件;用信号处理的方法对激光稳频中的电光调制、碘吸收调制和光电信号解调进行了系统地分析
该文针对RPR的关键技术进行研究,对RPR现有的问题提出了改进的方案并通过仿真进行了验证.该文采用非强占优先机制的M/G/1的排队模型,分析了采用单传递队列和双传递队列两种方