基于多粒度树模型的Web站点描述及挖掘算法

来源 :软件学报 | 被引量 : 0次 | 上传用户:kingorbread
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web所拥有的信息量和信息种类的急剧增长,Web站点挖掘对于自动实现特定主题的Web资源发现和分类具有重要的意义.然而现有的Web站点分类或挖掘算法在利用上下文语义信息、去除噪声信息以进一步提高分类准确率等方面还缺乏深入研究.从站点的采样尺寸、分析粒度和描述结构3个方面分析了设计高效的Web站点挖掘算法所需要解决的问题.在此基础上,提出了一种新的Web站点多粒度树描述模型,并描述了包括基于隐Markov树的两阶段分类算法、粒度间上下文融合算法、两阶段去噪程序以及基于熵的动态剪枝策略在内的多粒度Web站
其他文献
在以膜微滤为主的组合工艺对二级出水的处理过程中,二级出水水质可能对于微滤过程中膜污染的发展有较强影响.为此考察了2座污水处理厂及1个中试处理设施的二级出水水质,包括常规
存储管理是目前网络存储系统亟需解决的重要问题之一,解决存储管理问题的核心是自动适应外部环境变化,实现自我调整和自我管理,其中自适应是管理的关键.提出了一个解决存储管
在三峡库区最大次级河流嘉陵江现场采集水样,并进行藻类生长试验,探讨了藻类在氮磷比、光照强度和流速条件下的聚集行为.在不同TN/TP和光照强度的静水表层中主要藻类为蓝、绿
用固相萃取(SPE)/高效液相色谱法(HPLC)同时测定了松花江水中的13种典型内分泌干扰物(EDCs).结果表明,哈尔滨段江水中雌三醇(E3)、雌二醇(E2)、雌酮(E1)、乙炔雌醇(EE2)及乙烯雌酚(DES)5种雌