基于有向带权图的页面聚类算法研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:tangtongyue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类算法是数据挖掘中的一个重要的分析工具。Web使用挖掘中的聚类分析一般分为用户聚类和页面聚类。其中页面聚类是指导网站结构离线优化的重要方法。利用有向带权图表示用户的访问会话记录,对建立的有向带权图模型运用聚类算法实现页面聚类。选取真实数据对典型的聚类算法K—means算法、DBSCAN算法和COBWEB算法进行实验。实验结果表明,在选取的数据集范围内,COBWEB算法准确率要高于K—means算法和DBSCAN算法,时间性能与用户访问频率矩阵大小有密切关系。
其他文献
结合网格索引和R树索引的特点,提出了一种基于网格与R树的多级混合索引。该方案首先将矩形地理空间进行租网格划分建立多级网格索引,然后针对每个小网格建立基于R树的空间索引
据西部矿业2019年报披露,公司2019年实现营业收入306亿元,同比增长6%,净利润10. 07亿元。截至2019年末,西部矿业总计拥有的有色金属矿产保有资源储量(金属量,非权益储量)为铅
教育质量的高低取决于教育者的素质。几年来,为切实减轻学生过重负担,大面积提高教育质量,我校采取措施,大力加强师资建设,全面提高教师的素质。现已基本形成了一支政治上坚
苏联教育家乌申斯基说:“智慧不是别的,而是组织得很好的知识系统。”学生目前存在着一听就懂,—做就错,—过就忘的现象,主要是没有把基础知识牢固地记忆,而记不牢的原因,其
1穆龙套金矿(Muruntau)2016年产量68. 12吨。Muruntau金矿属乌兹别克斯坦政府所有,它轻松获得世界上最大的金矿的称号,其生产量几乎是排名第二的矿山黄金产量的两倍。但GFMS
静海县独流镇第二小学,在全校学生中积极开展在校做个好学生、在家做个好孩子的“双好达标”活动。在学生思想品德教育方面,取得了明显的效果。首先,该校根据《小学德育纲要
课堂教学是教学的主渠道,为了进一步深化教学改革,做好教师授课质量的考评工作,有必要对教学质量评估进行一番探索研充。笔者认为课堂教学和评估标准,可分为宏观标准和微观标
中文分词是中文信息处理系统中的一个重要部分。主题信息检索系统对分词的速度和准确率有特殊的要求。文中回答了词库建立的词条来源和存储结构两大问题,提出了一种基于专有
在保证生态优先的前提下,遵照"地尽其力,物尽其用"的原则,注重保护和开发相结合,充分提高土地的利用率。上海环城绿带的建设和发展可融入更多的农业元素,利用有限的土地资源,
沉积相分析是有机质富集及油页岩和煤形成和分布研究的基础。通过鱼油页1井岩芯的岩性组合、泥岩颜色、沉积结构和构造、含有物及接触关系等特征研究,结合显微镜下薄片鉴定、