论文部分内容阅读
Web的信息资源和信息服务的数量和复杂度都以惊人的速度增长着,一个站点能否吸引访问者,能否成功地引导访问者获得有用的、恰到好处的信息,成为这个站点是否能够成功的关键。这使得Web个性化成为Web组织者和终端用户所必需的工具。Web使用挖掘技术是解决这一问题的有效手段,通过对用户浏览网站的使用数据收集、分析和处理,建立起用户行为和兴趣模型,这些模型可以帮助理解用户行为,改进站点结构以及为用户提供良好的个性化推荐。在众多的挖掘技术中,关联规则的挖掘是Web使用挖掘领域的一个重要内容,有着广泛的应用。本文首先简要介绍了Web个性化服务的必要性。接着比较系统、完整地分析和论述了Web挖掘中的各项技术,并总结了现有的Web挖掘中的关联规则挖掘技术的研究成果以及目前关联规则挖掘算法的缺陷。然后通过对遗传算法的研究,文章着重讨论了将遗传算法应用于Web关联规则挖掘中的思想,提出基于遗传算法的Web关联规则挖掘模型;在深入研究的基础上,通过分析免疫算法和遗传算法的可行性和优缺点,引入免疫算子,针对遗传算法的不足,进一步提出改进型算法,以及基于免疫遗传算法的Web关联规则挖掘的应用。最后,一系列仿真实验结果表明:与传统遗传算法相比较,基于免疫遗传算法的关联规则发现在Web使用挖掘中具有一定的优势。