Web采集中信息组合自学习的研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:xiaopp1920
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web采集者为了尽可能准确地采集符合主题的网页信息,一般会根据多种Web信息来预测待采集链接的价值。文中为了提高Web采集系统预测链接价值的准确性,提出了一种能根据已采集页面自行调整Web信息重要性的Web采集者。它具有学习能力,能通过对训练集的爬行,分析出对于预测链接价值各种Web信息的重要性,以此调整采集过程中各Web信息的组合权值,得到符合实际Web情况的较优搜索策略。以计算机作为采集主题,对此算法和传统的Web信息固定组合的算法进行了比较。实验结果表明,较之传统的Web采集者,使用此算法的采集者具
其他文献
为了解决石油测井中水泥胶结质量识别误差较大的问题,采用八扇区水泥胶结测井仪进行声幅测量。仪器灵敏度变化以及泥浆对声信号的衰减所引起的误差可以综合利用首波幅度信息对
目的探讨重型颅脑损伤患者急诊手术麻醉对患者的影响。方法 50例重型颅脑损伤患者随机分为参考组和对照组,各25例,对照组采用的是吸入异氟烷进行麻醉,参考组进行静脉推注丙泊
最小二乘支持向量机在提高了支持向量机的运算速度的同时,失去了解的稀疏性。构造的多尺度稀疏最小二乘支持向量机,首先通过小波包分解对于数据进行多尺度描述,同时采用最小二乘