人工免疫聚类在Web日志挖掘中的应用

来源 :南昌大学 | 被引量 : 0次 | 上传用户:nihaosww
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web日志挖掘是从服务器端记录的用户访问日志或从用户的浏览信息中抽取感兴趣的模式,通过分析这些数据可以帮助理解用户的行为,最终可以指导企业明智的进行市场决策,更好的为用户提供个性化的服务。本文主要采用人工免疫的思想进行聚类,从服务器日志文件中提取出用户访问模式,为用户提供个性化服务。本文通过实际操作,选取南昌大学人文学院的日志为数据源,以Weka软件为平台,研究了日志挖掘技术及关键算法,详细介绍了数据预处理的过程,同时用实验加以实现。在研究聚类算法的基础上,针对当前传统聚类算法中所存在的问题,根据免疫系统的原理及Web日志数据的特性,探讨采用人工免疫思想进行Web日志的聚类分析。该算法运用免疫系统自身的自组织、自适应特性,由克隆选择原理和免疫网络原理相结合,同时,为每一个抗体添加类别标记,让抗体充分学习到抗原的特征,形成能代表抗原的记忆抗体,使得最后得到的抗体集合即为聚类结果,从而实现聚类。通过实验的验证与比较,证明了该算法的可行性及精确性,在理论和实践上都有着极为重要的研究意义。最后,通过聚类结果分析,从而为网站管理者提供网站结构修改的意见,更好的为用户提供个性化服务。
其他文献
近十年来,并行处理技术,包括从硬件,系统软件到各类应用软件的发展速度越来越快,甚至连小型终端的移动手机,处理器等都推出了四核,八核甚至更多,而且还配上了图形图像处理器GPU。高
SAP BW(Business Information Warehouse,商务信息仓库)是一件企业亟需的“采金器”,它也被认为是可以满足用户需求数据仓库系统中功能最强的一个,只有一个好的数据仓库数据
近年来,石油化工产业发展迅速,危化品[1]种类不断增多,存放这些危化品的仓库因此也越来越密集,甚至有些已经深入一些居民区,它们成为了威胁附近居民生命财产安全的定时炸弹。
随着媒体资源的不断丰富,如何有效地管理媒体资源已成为研究的焦点。本文主要研究基于SOA架构的媒体资源管理平台,实现对媒体资源及其服务的管理,解决了传统媒体资源管理系统
传统的企业应用集成技术已经不能适应企业信息系统的快速增长,Web Services的产生及发展为企业应用集成提供了新一代的技术。利用Web Services技术来实现企业应用集成可以解
IPv4技术的局限性限制了互联网的进一步发展,新兴的IPv6技术克服了原有协议栈的很多缺点,具有逐渐替代IPv4技术的趋势。这一替代过程需要较长的过渡时期,实现这种过渡的主要技术
空间数据固有的海量性和复杂性使得传统的数据库查询处理技术不能或不能有效地发挥作用,需要研究新的查询处理技术。因此如何提供各种高效的空间与空间对象查询处理技术是当
在大数据与不断增长的用户数量的复杂协作环境中,企业如何能够充分的整合现有的人力物力、业务与数据资源,使得企业的信息资源能够及时的交换和获取,这是一个企业提高竞争力
机器人技术综合了多学科发展的成果,涉及机械、电子、传感器、自动化、计算机、信息处理等多门学科。随着机器人教育的深入,机器人作为一种学习载体逐渐被人们所广为利用。如
随着Internet的飞速发展,Web的信息量越来越大,人们往往需要借助搜索引擎来寻找资料,为了解决通用搜索引擎返回的大量没用结果的通病,面向专业领域的搜索引擎即垂直搜索引擎