农业网站导航页面识别模型研究

来源 :新疆农业大学学报 | 被引量 : 0次 | 上传用户:vvlioo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对农业网站中大量存在的不含实际信息的导航页面,提出了将网页文本特征与非文本特征综合考虑来构建农业网站导航页面识别模型的方法。对农业网站导航网页两类特征:文本特征与非文本特征,利用HTML-Parser网页解析器、庖丁解牛分词器、卡方检验算法,结合最小二乘多元线性回归方法,进行了实验分析对比。经过对5 000张训练样本与1 400张测试样本的网页实测表明,将农业导航页面文本特征与非文本特征集结合构建的分类器,对农业导航网页有很好的识别效果.当特征词数目达到200以上,准确率可达94%左右且趋于稳定。
其他文献
利用地统计学原理与GIS技术,对古尔班通古特沙漠南缘梭梭林立地土壤特征及其空间变异性进行了研究。结果表明:研究区梭梭林立地土壤具有总盐含量普遍小于盐化指标(2.6 cmol/kg)、pH值均值大于9.0的典型碱土特征;土壤总盐、pH值和总碱度具有强烈的空间相关性,有机质和速效钾为中等强度的空间相关性;通过插值图分析,梭梭生长的区域总碱度低于无梭梭生长的区域,而梭梭周围土壤速效钾、有机质含量高于其它
2013年11月7日,省档案局召开党的群众路线教育实践活动专题民主生活会。提出立行立改,建章立制,切实把群众路线体现在全省档案事业发展的具体实践中,把为民务实清廉的根本要求落
为深入贯彻省委关于“四群”教育活动的相关要求,2012年1月7日至9日,省档案局黄凤平局长、赵炳荣副巡视员轻车简从,深入省档案局机关干部直接联系群众联系点巍山县五印乡开展驻