基于页面内容和站点结构的页面聚类挖掘算法

来源 :软件学报 | 被引量 : 0次 | 上传用户:axjlzpf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了结合站点拓扑结构和Web页面内容的页面聚类改进算法,改进算法引入Web页面的内容链接比和页组的组内链拉度,并修改了频繁访问页组支持度的计算公式,以此来提高挖掘结果的兴趣性,通过实验数据的比较,改进算法较一般算法的收敛性好,发现的频繁访问页组的兴趣性高。
其他文献
选择三江平原典型的毛果苔草沼泽湿地为研究对象,测定了沼泽湿地孔隙水中水溶性碳、氮浓度、CH4浓度和CH4排放通量,以及相关环境因子;研究了沼泽水中水溶性有机碳、氮浓度变化特
由于资源具有广域分布、异构、动态等特性,计算网格环境下资源的管理和调度是一个非常复杂且具有挑战性的问题.提出了计算网格环境下一组相互独立的计算任务(meta-task)的资
借助计算机的数值计算比较圆孔和单缝的Fraunhofer衍射的光强分布,得出了两者的中央亮纹所对应的分布曲线拐点数不同的结论,这可以作为区分两者的一个显著标志.
本文分析了目前MCAI课件的缺点与不足,提出了编写适应于网络环境的教学课件的思想与方法,并阐述了开发MCAI课件应遵循的原则.