基于结构与内容的网页主题信息提取研究

来源 :山东大学学报(理学版) | 被引量 : 0次 | 上传用户:guozhi1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
结合HTML网页内部特征与外部的结构布局,提出采用映射表这种网页映射模式对网页视图进行变换,基于结构与启发式规则对网页进行区域分割与识别,并利用向量空间模型时网页内容分析,从而准确得到具有高语义内聚性的网页主题内容.实验结果表明,此方法对各种复杂结构的网页主题信息提取较为理想.
其他文献
中国民族音乐作为中华文化的重要组成部分,为中华文化乃至世界文化之发展都作出了重要贡献。在中国巨大的文化宝库中,民族音乐是占有相当重要比例的宝贵文化遗产。