【摘 要】
:
为解决“信息过载”问题和满足专业领域信息需求,面向主题的Web信息整合技术逐渐成为研究热点。Web信息整合技术将位于不同信息源的分散的主题信息进行整合并提供垂直信息服
论文部分内容阅读
为解决“信息过载”问题和满足专业领域信息需求,面向主题的Web信息整合技术逐渐成为研究热点。Web信息整合技术将位于不同信息源的分散的主题信息进行整合并提供垂直信息服务。林产品商务网站中包含的林产品供求信息是一种重要的林业信息资源,整合互联网上分散的林产品供求信息是实现高效的林产品商务信息服务的基础。已有的研究对不同林产品商务网站中的信息进行了整合,但整合信息来自的信息源是由人工获取的,人工搜索不仅工作量大,而且获取数量有限。林产品商务信息源数量众多且分布广泛,需要一种林产品商务信息源的自动发现方法。本文首先介绍了现有的网站发现方法及相关技术,然后结合林产品商务网站的特点,提出了一种林产品商务信息源的自动发现方法,将信息源发现转化为网络搜索过程和网站分类过程。网络搜索过程的目的是从“种子网站”出发,在尽量少爬取网页的同时发现站外链接,对“种子网站”进行扩展;网站分类的目的是将符合条件的林产品商务网站从所有网站中区分开来。在网站分类时,研究建立了林产品商务网站特征词库,提出了一种基于关键资源的改进的向量空间模型来描述网站主题,使用基于SVM的分类器对网站进行分类判别。最后设计并实现了林产品商务信息源发现模块,通过实验发现了110个林产品商务网站,验证了所提方法的有效性,能够有效解决林产品商务Web信息整合中的信息源发现问题。
其他文献
随着我国工业化、城市化和现代化建设的不断发展,农业现代化发展的问题日渐彰显其重要性、紧迫性。土地问题作为“三农”问题核心的成为农业现代化建设的重要瓶颈,事关民生,举足
目的:观察优质护理在小儿重症肺炎中的应用效果。方法:选取小儿重症肺炎100例作为研究对象,按护理方式不同分为对照组和观察组各50倒。对照组给予常规护理,观察组在对照组基础
绿色发展理念是由习近平总书记提出的科学发展理念,主要针对我国生态文明建设,是中国特色社会主义理论体系的重要组成部分。在绿色发展理念下建设好红碱淖地区生态环境是当务
目的 探讨医护一体化诊护模式在小儿重症肺炎中的临床应用价值。方法 选取2015年1月—2016年12月在我院儿科就诊的40例重症肺炎患者实施医护一体化诊护模式作为观察组,回顾性
隐喻是从一个具体语域"始发域"向一个抽象语域"目的域"的映射,在这种映射中存在着一种实体对应关系.通常人们把较为熟悉的,具体的概念域映射到不太熟悉的,抽象的概念域上,以
在渤海上京城宫城内,采集到一件渤海国时期的带■,现藏于黑龙江省文物考古研究所,以往未作报道。带■完整,铜质,表面生满绿绣,边缘从正面向背面内折,截面观察呈“凹”字形,通
伪满洲国自1932年“建国”至1945年灭亡期间,一直都在进行农业“增产”,但尤以后期(1940~1945)的规模最大,最具代表性,并被日伪政府标榜为农业“增产运动”。伪满洲国后期,日本侵略
主要利用MATLAB提供的工具函数,对概率论中的抛硬币、掷骰子问题,二项分布的泊松近似,生日问题及中心极限定理进行验证计算及可视化模拟,进而加深学习者对经典概率问题的理解
批量评估与传统的单项评估相比,具有效率高,节约评估人力和费用,评估过程受人为因素影响较小等优点。林木资源资产批量评估是指在给定的时间,引用共同数据,建立自动评估模型,对类似