基于校园网用户行为日志的数据挖掘研究

来源 :南京农业大学 | 被引量 : 0次 | 上传用户:guanshui5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高等学校是最早应用互联网技术构建计算机网络的机构之一,随着架设在校园网中的各项应用服务的增多,生成了海量的网络用户行为数据。而随着数据挖掘技术应用的不断深入,利用数据挖掘技术对校园网进行知识发现研究具有非常大的应用价值,因此对用户行为的日志进行分析将是今后网络研究和管理的一个重要方向。本文旨在通过探究和分析用户行为日志记录中的规律,构建网络用户分类模型,掌握和预测校园网运行状态,从而提高用户服务质量和增强相关管理者主动服务意识。本文首先针对用户群体行为的四个方面进行研究,即分时间段的在线人数分析、用户在线时长的分析、用户使用流量的分析和用户访问目的地址分析。其中,在访问目的地址URL分析过程中,利用Perl语言实现了抽取海量用户日志中的地址字段并进行分类统计的高效程序。掌握了以上的用户群体行为,可以引导网络带宽分配等相关工作的开展。在对用户群体行为的充分理解基础上,本文提出了用于校园网用户行为分析的模型,并实现了对南京农业大学工学院校园网用户行为的系统分析。首先对数据挖掘技术在用户行为分析中的应用进行了探讨,提出了聚类算法的实现思路和方法。接着对K-means聚类算法进行了研究,并利用SQLServer2005提供的数据挖掘工具,基于K-means算法对计费网关日志记录进行挖掘,对用户使用模式进行聚类,并分析和评价所挖掘出来的模型。同时,本文还基于时间序列算法对不同用户类型的流量进行了预测和分析。总之,上述相关用户行为模型和流量趋势的研究,对于网络策略的制定具有参考和指导意义。
其他文献
目前网络学习资源日益繁多,面临着资源分散、资源冗余、共享性差、对资源检索难以实现预期希望的现状。从生态学的角度讲,就是各个物种之间的某个食物链和能量链(知识链)缺失
随之科技的迅猛发展,如今的手机已经不单单是一种通信工具,他的处理能力可以与一台小型的计算机相媲美。与此同时,无线网络的传输能力和传输质量的不断提高,3G时代的到来,这
近年来,随着各种高速超大容量网络迅速普及,人们对信息的安全性需求变得越来越迫切,然而,信息安全技术仍然很落后,且信息安全算法的软件实施已成为网络性能提高的系统瓶颈。
以Internet为代表的信息网络已成为现代社会最重要的基础设施之一,它逐渐渗透到社会的各个领域,成为知识经济的基础和载体,并在人类社会的政治、经济、军事、文化和商业等各
生物信息学是一门交叉科学,它包含了生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据
随着Web服务技术的成熟,越来越多的企业将自己的业务作为Web服务发布到互联网上。然而,一个单独Web服务的功能并不完备,只有把互联网上多个简单的Web服务按照一定的逻辑顺序组合
传统关系数据库具有良好的可扩展性、高可用性、高稳定性,得到了广泛使用。但关系数据库毕竟是通用型的数据库,存在灵活性不足,大数据量情况下响应速度慢等问题,因而不能完全
半分布式P2P(peer-to-peer)僵尸网络因具有很高的隐蔽性和健壮性,正在成为新型的网络攻击平台,对互联网的安全造成越来越大的威胁。为逃避检测,一方面,半分布式P2P僵尸网络的
随着互联网的不断发展,P2P流媒体视频系统面临着严峻的安全问题,主要包括传输安全与内容安全,这两者中又以内容安全尤为引人注目。但P2P流媒体视频本身的特点使得信息摘要,数
随着我国3G市场国际竞争的不断加剧和手机定制化的发展趋势,手机软件平台的作用日渐突显,这也是我国3G产业链的瓶颈所在。目前的手机软件平台或开放性不够、或体系结构复杂、