基于统计-规则方法的网页层次分类技术研究

来源 :现代图书情报技术 | 被引量 : 0次 | 上传用户:jrno1213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于统计的自动分类是网页层次分类中常用的技术,但其有不足之处,主要表现为当子类之间出现严重的特征交叉现象时,分类精确率将大大下降。而网页层次分类的本质决定了同一大类下的子类存在许多相同的特征。针对这一局限性,结合基于规则的自动分类技术的优点,提出一种基于统计一规则方法的网页层次分类技术。实验表明,基于统计一规则方法的网页层次分类技术能够获得比较理想的分类效果。
其他文献
本文是一篇翻译报告,翻译项目原文为约翰·贝拉米·福斯特(John Bellamy Foster)和弗雷德·马格多夫(Fred Magdoff)所著的《金融大危机:成因和后果》,该原文曾于2009年在《每
以亚历山大数字图书馆项目将数字图书馆馆藏、知识组织系统、服务设施在数字图书馆环境中互相配合的实践为例,讨论在数字图书馆结构中将知识组织系统作为有机的组成部分的意义
介绍J2EE性能管理的一些方法,包括性能监控、瓶颈定位、性能调优等方面内容,并以运维NSTL网络服务系统的实践经验,介绍NSTL性能监控和调优的方法及效果。
本文选定苏式年糕作为调查研究的对象,通过对其历史、食文化进行挖掘与整理,探索出一套合理可行的保护与传承的方法,以期对今后传统食品及其技艺的保护具有一定的借鉴意义。
<正>江苏省东台市实验中学教育集团加强教师团队建设最为突出与鲜明的举措,是实施教育领域的供给侧改革:优化发展&#39;供给侧&#39;,增强教师&#39;获得感&#39;。学校是教育供
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
将6~18目橡胶颗粒按细骨料的10%掺入混凝土后,外掺2、4、6、8 kgm3的塑钢纤维,研究橡胶混凝土基本力学性能的变化规律。试验结果表明:随着掺量的增加,7 d抗压强度逐渐降低;
近年来,随着中国旅游市场在国际地位上的上升,旅游文本的英译问题逐渐受到翻译研究者的热捧。基于此背景,本论文从系统功能语法学派的信息结构视角对广西北部湾四个主要城市
日本财务省统计发布2016年日本印刷机械出口数据,2016年日本印刷机械出口额继续呈下降态势,降到910亿目元,同比减少14.8%。
安姆科集团宣布,将在欧洲医疗包装市场上投资一系列的柔性印刷设备与技术。首先将投放最先进的印刷机在英国、瑞士和德国的医疗包装市场。但是安姆科还未透露投资的规模和具体