Web日志挖掘中的数据预处理研究

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:srepair555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web日志信息的预处理是Web日志挖掘任务中的重要阶段,是整个Web日志挖掘过程的基础和实施有效挖掘算法的前提,在Web日志挖掘中起着重要的作用,也是工作量较大的一部分.数据预处理的基本技术,包括数据清理、数据集成和转换、数据归约等.本文介绍了数据预处理中涉及到的数据清理、用户识别、会话识别、路径补充、事务识别等过程,并提出了一种路径补充算法.
其他文献
目的:了解移动式多媒体电化宣教新模式在心内科健康教育中的作用.方法:选择心内科患者160 例,随机分成对照组和观察组各80 例,分别采用多媒体宣教法与传统宣教法进行健康教育
目的 探讨心上型完全性肺静脉畸形引流X平片表现,以提高对本病认识.方法 分析经心血管造影证实的1例心上型完全性肺静脉畸形引流X平片表现.结果 本病具有典型的"8"字形心影,
民族旅游的内在属性和特征与标准化的本质和要求之间的矛盾导致了标准化建设的困难,标准化对象复杂性和多元性特征导致了标准化实践和普及的困难。民族旅游标准化的建设思路
本文阐述了大型数控车铣床电气系统的技术改造
通过对不同电压等级、不同设备等电位带电作业时电场分布的计算,得出人体与周围设备的电场分布图。给出不同工况下人体周围的最大场强和最大畸变率,以及人体进入高电位过程中的
以2个电厂的SCR脱硝系统为典型研究对象,分别统计和分析2个电厂烟气中烟尘含量、 SCR系统运行情况以及催化剂活性的变化情况。根据催化剂催化原理,结合SCR系统特点及实际运行情
文中在研究湖南省电力公司220 kV变电站无人值守模式现状的基础上,对1例线路跳闸事故进行分析,旨在从调度运行角度探讨变电站无人值守模式下的改进措施。
针对某电厂330 MW对冲燃烧锅炉投产后炉膛出口氮氧化物浓度偏高的问题,对现场试验数据与设计值进行对比分析,结果表明:蒸汽温度偏低导致的燃尽风无法投入,一次风率偏高,主燃
结合大功率柴油机配机要求,进行了高压共轨喷油系统共轨管结构设计研究.针对某型军用柴油机结构和共轨管结构特点,提出适合的柴油机高压共轨系统方案,确定了双轨结构型式的共
采用有限元软件建立一预应力混凝土变截面单箱单室连续弯梁模型,分析其在相同跨径不同曲率半径下的内力,由此得出弯梁桥内力受曲率半径的影响.