中文网页分类中的网页特征提取方法

来源 :电脑开发与应用 | 被引量 : 0次 | 上传用户:dh184866884
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了网页信息的有效组织和检索,针对网页中的超文本结构特征,在研究网页间的超链接、超文本标记对信息提取的作用的基础上,阐述了一种基于"超文本标记加权"和"超链接森林"的因特网信息提取方法,并与传统方法进行了对比.实验结果表明,该方法用于网页的自动分类具有较好的效果.
其他文献
民歌是表现和记录人们生活和情感的最直接最灵便的方式。它在民间历久不衰,是民间文化中永远绚烂的花朵。民歌的价值也很早就被发现了。中国自古以来就有从民间采集整理歌谣
鲁迅是中国现代小说的鼻祖,在他的《呐喊》、《彷徨》中所体现出的叙述技巧令人叹为观止。但是,作为开创新形式的先锋,鲁迅遇到的困难也是不言而喻。与古代传统白话小说的无所不
为了减轻PSTN网络的重荷,增加新老业务,通过对H.323核心协议及技术的分析,提供了一种小型综合接入设备的设计方案,该方案具有设计灵活、功能齐全、易升级等特点,具有很强的市
为适应不同机构使用的需要,从而为选择过程改进战略提供指南.介绍了CMM的产生、现状与发展,阐述了它的五级分级结构及特点,比较了CMM与CMMI的异同点及应用,从而指出要想使软
为了提高企业自身竞争力和对抗外资企业的"圈地运动",国内零售业纷纷形成战略联盟.通过研究国外现有两大零售业采购联盟机制及联盟信息平台WWRE和GNX的主要功能模块,提出了一