基于本体的主题爬虫技术研究

来源 :计算机仿真 | 被引量 : 7次 | 上传用户:lszh2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最好优先搜索算法在主题页面附近搜索时能够表现出良好的性能,但算法只关注能"立即回报"的链接而容易遗失那些有远期价值的链接,导致当搜索位置距离主题团较远时容易迷失搜索方向。在最好优先搜索算法基础上,引入了本体帮助主题爬虫识别那些"未来回报"的链接,对抛弃的主题无关链接再基于领域本体进行一次其他主题相关度的判断实验。实验结果表明,基于本体的主题爬虫能够抓取大量主题相关度高的网页,提高了主题资源覆盖率,有效解决了传统算法无法穿过隧道的问题。
其他文献
会议
现如今我国正处在经济快速发展的一个阶段,人们对于对于日常生活以及精神层面的需求都发生了许多崭新的变化,当下如 果我国想要使自身在国际的竞争平台中获取更大优势的话,那
为避免冲压过程中由多弯曲多形孔结构引起的零件外部边界与内部形孔误差而导致的级进模开发失败,应用全工序方法开发出一套特征件级进模.首先设计了一个带有多弯曲多形孔特征
足球机器人的决策系统是一个多智能体协调控制系统,控制机器人运动需对机器人未来的方位进行实时预测。为了解决RoboCup小型组比赛系统的延迟和准确定位问题,将BP神经网络应用于决策系统的局势预测中。建立了基于BP神经网络的线性预测模型,确定了神经网络的拓扑结构,并将训练好的网络应用于现有比赛系统,预测机器人的就位效率、协调及配合能力,进行仿真实验。实验证明,方法对机器人的位置、方向等预测比较准确,证
2016中国国际农业机械展览会期间,代表企业综合实力的多种农机产品纷纷亮相,令人目不暇接.从展会上可以看出,我国主流农机企业围绕精准农业、智能农业,加大产业转型和产品升级,致力
高中语文不仅是学生们学习母语的积淀,同时也是祖国传统文化传承的一部分。在高中语文教学中教授语文基础知识的同时, 培养和锻炼学生的语文思维能力也同等重要。所以在语文
问:我的工作性质决定要经常加夜班。开始时,我没有什么感觉,可是,随着时间的推移,以及年龄的增长,慢慢感觉夜班对身体的不良影响。请问,加夜班时是吃咖啡、浓茶之类的饮料好,
期刊
《延边大学学报(自然科学版)》是由延边大学主办的自然科学类综合性学术刊物(季刊,国内外发行).本刊立足本校,面向全国,主要刊登有创新内容,数据翔实,表述规范的基础理论及应
针对饭店高位转换层结构选型及抗震概念设计进行分析,结合某饭店建筑,介绍了该建筑的特点,同时分析了饭店高位转换层结构选型,主要研究了方案设计和深化结构设计。最后,结合
<正>笔者研究了不同品种、类型牛在乌克兰草原地区产肉性能形成的规律,目的是应用这些规律来进行牛肉生产,确定适应性和强度或适度饲养条件下的最佳肥育期限。 方法 试验是在