【摘 要】
:
随着互联网的迅速普及和广泛的应用,Web上产生的信息也随之飞速增长,如何从浩瀚资料中挖掘出有价值的信息,受到各方面的关注;另一方面电子政务蓬勃兴起,中央和各个地方政府的
论文部分内容阅读
随着互联网的迅速普及和广泛的应用,Web上产生的信息也随之飞速增长,如何从浩瀚资料中挖掘出有价值的信息,受到各方面的关注;另一方面电子政务蓬勃兴起,中央和各个地方政府的门户网站迅速建立,企业和个人通过门户网站来获取信息和得到服务日渐普遍,由此也积累了大量的访问信息。为了更好地掌握企业和个人的具体需求,为如何办好政府网站提供更多的依据,采用数据挖掘技术对政府网站的访问信息进行处理也提到了议事日程。 本研究在简述了Web日志挖掘的概念、研究内容、关键技术和目前的国内外研究状况的基础上,针对杭州市江干区政府门户网站的访问日志,采用数据挖掘技术进行数据分析,从而找出用户访问规律和内容喜好,为改进网站结构和内容提供了决策支持。论文所做的主要工作是: ① 对Web日志的预处理进行了研究,给出了预处理的流程并分析了其中的难点; ② 对其经典Apriori算法进行了剖析,并通过缩减数据项集的办法来提高Apriori算法的执行效率,提出了改进算法M-Apriori算法; ③ 对路径遍历模式挖掘进行了研究,尝试将其用到江干区政府
其他文献
人脸识别是模式识别研究领域的重要课题。在过去几十年,人脸识别的研究更多地停留在理论意义之上,自20世纪80年代末90年代初以来,随着信息安全的重要性日益突出,人脸识别技术
针对地理信息系统对矢量化电子地图的需求,本文设计并实现了纸质地形图矢量化系统。本文用数学形态学相关理论方法实现了对扫描图像的分割,并且对具有同一线型但不同线宽的线状
集成学习方法能够将原本表现一般的弱分类器集成起来,显著地提高学习系统的泛化能力,从而得到更好的预测精度。同时由于集成学习方法具有灵活的适应能力,它已经被成功地应用
属性约简是粗糙集理论研究的重要内容之一,是在保持信息系统分类能力不变的基础上,删除冗余属性。为了获得决策系统中属性最小相对约简,将信息论应用于决策信息系统属性约简中,并
对于分布式系统,国内外已进行了长时间的研究。通常采用中间件的解决方案,来解决异种环境中的互操作性。研发前期,人们主要将精力集中于系统的跨平台、跨环境的互操作问题的
拓扑控制有助于减少网络能耗和干扰,改进网络吞吐量和生存周期,同时传感器节点因其体积小,部署方便等优势广泛用于无线网络,但由于节点本身物理特性的限制导致节点的能量有限
相变存储器(Phase Change Memory,以下简称PCM)是一种新型计算机存储技术。近年来的研究主要把它定位为下一代内存载体。相比较于传统的动态随机存取存储器(Dynamic Random Ac
为了完整、真实地保存一幅图片信息,需要详细记录每个象素点的颜色信息,所占用的物理空间是极其庞大的。而这种图像在图像存储和图像传输等环境中几乎是不可接受的,因此对图像进
本文从理论和实践上试图为目前方兴未艾、尤其是面向国内中小销售类企业的中小型低成本的企业信息应用系统的开发实施提出的一种综合性的解决方案。文中所提出的解决方案以
知识正成为生产力要素中最活跃最重要的部分,知识的创新和应用使企业在竞争中不断发展。随着技术的发展和竞争的加剧,知识管理成为知识密集型组织中业务过程管理以外的另一项重