基于网络生态链的主题信息采集研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:hgs19741022
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web信息资源已成为各个领域可利用的最大信息资源库,但其过度增长的规模已超越了人们传统的利用能力,且这种态势还在进一步加强。如何从海量Web资源中快速准确地获取主题资源已成为各个领域关注的重要话题,互联网信息资源的分布状况与分布规律的发现是其中的关键。   本文从生态学的视角分析发现,同类主题的网站通过超链接与内容引用彼此抱团,在网站之间通过网络生态链形成主题网站群;主题网站群由核心主题网站层和外围网站层构成,其中,核心主题网站层的网站由于其规模和影响力主导了主题网站群的发展,整个互联网可以看作是在一定时空下由各种主题网站群所构成的复合体。网络生态链的分析方法为研究互联网资源的分布规律及主题资源的获取与建设提供了一种新的思路。   同时,本文以此为理论依据,在深入分析了现有的研究成果的基础上,尝试结合网络生态链的功能类型、结构类型等因素进行资源的主题相关度评价,提出了以网站为粒度的主题相关度判定公式,形成了网络生态链层次算法、核心主题网站群进化算法、主题爬虫爬行算法,并用实验验证了其可行性,从而为主题资源的获取与利用,以及主题网站群的建设提供理论指导与算法支持。
其他文献
体验经济时代到来,体验式消费需求增加。体验式体育消费将成为消费热点和新的经济增长点。随着经济的高速增长和人们生活水平的提升,职业体育进入快速发展的黄金时代。观赏职
空间(关系)推理是涉及空间领域的推理,它是演绎推理中关系推理的一种特殊形式,通常要求从描述空间关系的前提中推论出隐含在其中的结论。它被广泛用于验证心理逻辑理论和心理
研究以小学高年级孤儿学生为被试,将积极心理干预技术与积极心理教育相结合,基于小学高年级孤儿学生的认知发展特点和现实状况,设计了一套小学高年级孤儿学生主观幸福感干预
在任务转换的研究中,转换代价的问题得到广泛的关注,并已取得了卓有成效的成果,而关于混合代价的研究则比较薄弱。混合代价反映了从事简单的近乎自动的单一任务与复杂的需要
游戏是幼儿最基本的活动,幼儿最为喜爱的游戏活动不仅能反应幼儿身心发展各阶段的特点,更能反映幼儿发展的需求。游戏对于幼儿的作用是不可小觑的,不仅能促进幼儿身体运动能力的
利用大功率钻机,在突出煤层掘进中进行打钻预抽瓦斯是近几年发展起来的一项新技术。通过对国产300型钻机和150型钻机实施不同直径钻孔的预抽对比分析,论证了大功率大直径钻孔
职业教育是以培养数以亿计的生产、建设、管理、服务第一线技术应用型人才和熟练劳动者为目标的教育类型,是国家教育体系中的一个重要组成部分。职业学校普遍都设置专业,按照
工程造价全过程控制是动态的。在建设过程中,由于不可控因素的影响,工程造价的动态因素必然会影响到造价变动。本文主要分析了工程造价动态变化过程,对如何做好工程全过程控制进
可以毫不犹豫地讲,每一届奥运会都是见证媒体变革和发展的里程碑。因为四年时间能够容纳太多新的媒体形态和媒体技术。而且奥运会这样的大事件可以从多个角度展开全方位的报
Elana S,Radouane等人用ERP实验验证Fischer2003的数字加工引起空间注意转移的研究,结果发现SNARC效应可能和工作记忆有关。而Amparo Herrera等的实验结果也表明SNARC效应跟