基于WEB挖掘的网站结构优化技术研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:languihe71
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web技术不断创新,特别是物联网技术跨越式的发展,使企业能够利用传感器、射频等智能装置对物理世界进行感知识别,依托通信网络实现了人与物、物与物的信息交互以及生产生活信息的无缝连接,有效地集成了Infranet、Intranet、 Internet。这使得Web上信息量无比丰富,给人们生活提供了极大方便,但同时在客观上也增加了用户从海量数据中获取所需信息的难度,用户在面对众多的超链接选择时经常会产生一些无益于到达其目标页面的无谓点击行为。这一方面增加了Web服务器负担和网络的数据流量,造成网络阻塞,导致网络访问速度的下降,从而进一步影响信息搜寻行为的效率;另一方面阻碍了企业开展有针对性的电子商务活动。目前针对这类问题的主要解决方法是WEB挖掘,其中一种有效的方法是网站结构优化技术,它通过使用数据挖掘技术找到现有网站结构存在的不足之处并进行改善。目前存在的多种网站结构优化技术中,基于Web使用挖掘技术的网站结构优化是一个重要的研究方向,Web使用挖掘技术可以充分利用访问日志等信息发现用户的访问模式,并通过分析和研究Web日志记录中的规律来指导电子商务网站结构优化工作的进行。本文系统地阐述了从数据挖掘、Web数据挖掘到Web日志挖掘整个过程,主要工作成果为:(1)研究了通过Web日志挖掘优化网站结构的过程,提出了一种通过挖掘用户期望页面来优化网站结构的算法,该算法主要以更早和更少的回退两个不同的角度去优化发现期望页面的过程,分析表明,该算法可以更有效的发现用户期望页面,从而实现网站物理结构的调整和再组织。(2)提出了一个针对分布式动态网站的Web日志挖掘数据预处理方法。在数据清理之前加入了数据合并过程,提出了日志合并算法,在该算法中充分考虑了服务器的时钟同步和时区差异对日志合并的影响,在数据清和用户识别部分添加了页面过滤部分。改进了框架式结构页面过滤算法,为了消除框架页面对Web日志挖掘算法的影响。(3)针对学校网站,利用上面的算法,设计和实现站点结构优化工具。通过该工具,可以收集用户访问日志和站点结构数据,并使用日志清理工具上述数据进行清理和转换。站点结构优化组件使用这些数据挖掘用户的期望位置,并根据这些结果调整网站的链接拓扑,以给用户提供便捷易用的链接,优化网站结构。
其他文献
双目立体视觉是计算机立体视觉中最具应用价值的立体视觉方法,它的原理是模拟人类视觉行为感知、识别客观世界的生理过程,对同一物体从不同的两个视角进行观察,获取不同视角
在目前采用的安全措施中,权限管理起着重要的作用。权限管理是整个系统的基础部分,是业务控制管理的核心,它的安全性、效率以及稳定性影响着整个系统的正常运行。访问控制是
高分辨率多光谱卫星图像不论是在军事方面还是在民用方面,都得到了政府机构和私人机构的广泛应用。在其他方面,卫星图像在特征提取方面应用广泛,尤其在摄影测量、水道、地图和远
人体动作分析是人机交互的一个重要研究问题,在以人为中心的自然人机交互系统中,准确和快速地识别人体动作是实时交互的前提和保障。早期的人体动作分析大多基于二维视频图像
随着社会、经济、文化等各方面的发展,广大企业的决策者对明确本企业存在的问题、问题预警、策略生成、辅助决策等都有着迫切的要求。个人也有解决矛盾问题的需求。然而随着
基于RFID技术和人脸识别技术的检票系统与“身份证十二维码”检票系统相比,具有无需示出、防身份泄露、检票效率高等优点,应用前景广泛。本文对这一课题进行了研究,设计了一
WPF是由微软公司发布的一个崭新的计算机图形学表现层技术,作为Windows下全新的界面设计引擎,主要用于Windows的统一显示子系统。它为用户界面、2D/3D图形、文档和媒体提供了
随着网络应用需求的不断变化以及网络创新的不断推进,传统网络设备数据与控制平面的紧耦合使得其不能够提供灵活的网络控制、自动化的网络配罝以及开放网络能力等。SDN(Softw
结构化P2P网络是一种分布式网络,由于用户对存储资源的需求存在不均衡性,以及各计算机的处理能力存在异构性,导致系统出现负载不均衡现象,进而引起单点失效、请求延迟、网络