一种融合本体和最小二乘支持向量机的主题爬行方法

来源 :天津科技大学学报 | 被引量 : 0次 | 上传用户:linux_secway
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有的主题爬行方法存在收益率不高和不稳定的问题,融合本体和最小二乘支持向量机理论,提出一种主题爬行方法 Ontology-LSSVM.该方法将本体作为抓取主题的背景知识表示,得到一组主题相关概念的集合,再将其在网页文本中出现的词频作为输入,构造一个主题相关度LS-SVM分类器,用于网页的分类.使用舆论热点的食品安全问题作为爬行主题领域,建立问题食品本体,进行实验.结果表明:在本实验条件下,本文方法相比基于LS-SVM、基于本体和基于关键字的主题爬行,能够维持更高的收益率.
其他文献
本工作研究了加氯化镁(MgCl_2·6H_2O)的浮选菱镁矿轻烧粉末的形貌及性质,结果表明,加入氯化镁添加剂可损坏菱镁矿母盐假象,改善粉末性质,促进MgO烧结。主要是氯化镁的加
我国拥有丰富的海卤水资源(如海水、盐湖卤水、地下井卤及油气田卤水),在西部4省区分布了1,000多个、总面积近5万km2的盐湖,卤水中蕴藏着丰富的钠、钾、镁、锂、硼、溴、铷、铯
验证了高层半固体琼脂试管法比固体琼脂平板法更具有良好的厌氧性能,能准确地对酪酸梭状芽孢杆菌进行活菌计数.通过对发酵培养基中不同碳源、氮源、生长因子进行单因素研究,L
以β-环糊精(β-CD)为原料、环氧氯丙烷为交联剂、碳酸钙为致孔剂合成β-环糊精-环氧氯丙烷交联物(β-CDP)、碳酸钙致孔β-CDP(Ca-β-CDP),并用红外光谱对其进行表征.以这两种交联产