面向WEB数据挖掘应用的仿生类算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:Eryuelan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在Internet浪潮的冲击下,尤其是Web的全球普及,使得Web上的信息量无比的丰富,人们面临着数据爆炸的挑战。数据挖掘是通过挖掘数据仓库中存储的大量数据,从中发现有意义的新的关联模式和趋势的过程。通过对Web数据的挖掘,不仅可以得出关于群体用户访问行为和方式的普遍知识,用于改进Web服务设计,更重要的是,通过对用户特征的理解和分析,有助于开展有针对性的电子商务活动。而仿生类算法是应用于数据挖掘领域的重要工具。  本文在分析了蚂蚁觅食行为和Web用户访问行为相似性的基础上,给出了基于蚁群的Web自适应站点算法,通过该方法,能使用户通过最优路径到达目标页面。另外,受蚂蚁能识别与之相遇蚂蚁是敌是友行为的启发,给出了基于蚁群本能识别能力的Web用户聚类算法,通过用户事务的相似度矩阵实现了对Web用户模式的聚类。  另一方面,本文在分析遗传算法基本理论的基础上,将标准遗传算法和K-均值划分聚类方法有机的结合,给出了一种用混合遗传聚类方法对Web用户的行为进行分析的方法。该方法是一个具有全局最优解的聚类方法,其结果明显优于标准遗传聚类方法。该算法能够有效地剔除噪音,得到很好的用户聚类和页面聚类效果,为网站的管理者设计个性化的商务网站提供了有效的决策依据。  最后,本文综合利用遗传算法的快速全局搜索能力和蚁群算法的正反馈收敛机制,优势互补,给出了一种融合的Web挖掘算法,该算法比单独的蚁群算法以及遗传算法在优化性能和时间性能上有一定的优势。
其他文献
1980年,Lowell Beineke和Richard Ringeisen[1] 提出了共色指标的概念。对图G的边集进行划分,使划分所得的每个子集是边独立集,星或三角形,则称这种边分划为G的一个边共染色,而这
近年来,图像处理和计算机视觉中应用偏微分方程(主要涉及抛物型方程),特别是基于曲线和曲面演化的偏微分方程(主要涉及反应扩散方程)受到国内外很多学者的广泛关注和重视.而带有爆
Adomian分解方法是用来求解线性和非线性常微分方程的一种实用而且有效的方法。本论文考虑了奇异初值问题、奇异边值问题、边值问题以及非线性振荡问题。  研究了Lane-Emde
本文研究了一类带有有毒物质影响的浮游生物模型.浮游植物释放有毒物质能够减少浮游动物的增长,从而减少摄食压力.首先对模型进行非量纲化,减少参数个数.然后给出正稳态解的先
学位
短期负荷预测是电力系统调度运营部门的一项重要参考指标,由电力市场发展的趋势来看,短期电力负荷预测将在其发展中起着越来越重要的作用。因此,如何进行科学的短期负荷预测,提高
Guichardet-Fock空间是由复可分的Hilbert空间η与Γ上的平方可积函数空间的张量积所构成的空间,即叩η⊕L2(Γ),其中Γ∶={σ包含于R+∶#4σ<∞}.本文主要讨论了Guichardet-Fock
本文分别在固定和随机切换有向拓扑下研究具有饱和输入的线性多智能体系统的包含控制问题,利用代数图论和切apunov控制方法证明了相应结论。在固定有向拓扑下考虑非周期间歇通