基于Ontology的面向主题的网络信息采集算法

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:jiwei1058
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
介绍基于内容评价的、基于链接结构评价的和基于巩固学习的三种采集算法的优缺点;介绍一种依据词典构建主题Ontology的方法,该方法有助于提高Ontology的构建速度;最后,在分析传统采集算法的基础上,提出一种新的基于Ontology的面向主题的网页采集算法,并通过试验证明其优越性。 This paper introduces the advantages and disadvantages of three kinds of acquisition algorithms based on content evaluation, based on link structure evaluation and consolidation learning, and introduces a method of constructing thematic Ontology based on dictionary, which can help to improve the speed of Ontology construction. Finally, Based on the traditional acquisition algorithm, this paper proposes a new topic-oriented webpage collection algorithm based on Ontology, and proves its superiority through experiments.
其他文献
认为数字资源长期保存的目标是真实性、永久性、有效性和安全性,探讨其图像格式的选择要求,并对其生产、保存和利用等三个不同阶段的图像格式的特殊要求进行分析。
介绍图书情报机构文化建设中“以人为本”的理念的内容,并从吸引、录用、保持、发展、评价和调整6个环节阐述图书情报机构人力资源开发过程中的文化运作方式,认为从文化建设
期刊定级涉及学科原则、导向原则、分级原则、动态原则、数量和质量原则。通过分析我国高校期刊定级的依据和定级的现状,指出我国高校期刊定级中存在重外轻内,学科定级混乱等
分析国内海洋水产特色数据库建设的现状,针对海洋信息资源建设和服务中存在馆藏资源不足,特色数字化资源不足、资源共享水平不高、海洋文献服务针对性不强等问题,提出数字时
在论述信息共享空间(IC)实现目标和构成模型的基础上,指出IC规划与建设的步骤和实现方法。分别从实体层、虚拟层和支持层3个组成部分,详述在规划与建设时必须认真思考的馆舍
在统计刘国钧先生1926—1937年间发表在《图书馆学季刊》上的论文的基础上,分析《图书馆学季刊》的学术作用,指出刘国钧先生在这一阶段的主要学术特征,认为刘国钧先生的主要
分析开放存取运动兴起的原因,认为科学研究人员非赢利的信息传播动机和利用需求是其存在的前提,而网络为开放存取提供了平台和条件。同时,指出科学研究资助机构、科学家、大
Based on the daily maximum temperature data covering the period 1961-2005, temporal and spatial characteristics and their changing in mean annual and monthly hi
国家体育总局于2006年举办了“第五期高层次体育教练人才赴法国研修班”,通过与法国击剑国家队的直接业务交流和近距离观摩他们的个别训练课,击剑项目的几位年轻的国家队教练
新课改倡导以发展学生的主体性为宗旨,把"以学生发展为本"作为新课程的基本理念,关注学生的学习兴趣和经验,倡导学生主动参与、乐于研究、勤于动手,形成积极主动的学习态度,在获得基