基于Web信息抽取的个性化信息服务研究与实现

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:biuesnow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的出现极大地丰富了人们的信息来源。然而由于缺乏统一的组织和管理,人们在浩瀚的信息海洋中却难以找到所需信息。当前各种信息服务技术,如搜索引擎、基于Web Service的服务集成等,要么精度不高、返回结果过多,要么仅局限于提供Web Service接口的信息资源、覆盖范围有限,难以满足人们日益增长的信息需求。鉴于Web上绝大部分信息资源以半结构化形式存在的现状,本文在研究Web信息抽取技术的基础上,提出了一种“基于Web信息抽取的个性化信息服务”框架WINIS(Web INformation extraction based personalized Information Service),主要着眼于传统搜索引擎难于发现、隐藏在Web站点后台数据库中的丰富信息(也称为暗藏网),尝试通过Web信息抽取技术获取该类资源,从而为用户提供个性化的信息服务。基于WINIS,用户无需关心信息的来源和获取的方式,只需描述自己的需求即可简单、高效、快速地获得目标信息。可以将WINIS简述如下:在框架的个性化信息服务层,系统通过定义任务模式来描述和解析用户请求,并提出基于用户目标的个性化结果整合策略。在框架的Web信息抽取层,采用一种基于本体的Deep Web信息抽取方法来获取暗藏网中的信息资源,在保证抽取质量的同时大大减轻了用户负担,有效解决了现有方法中用户负担大、缺少待抽取页面获取过程、抽取结果缺乏语义信息等问题。以WINIS框架为指导,本文构建了E-Planning原型系统并进行了实验分析。分析结果表明,基于WINIS框架的E-Planning系统在信息抽取质量、结果方案生成以及系统扩展性等方面都达到令人满意的结果,从而验证了本文提出的WINIS框架的有效性。
其他文献
在嵌入式系统中,常常需要开发一些复杂的应用,同时还要满足性能和功耗的要求。为了达到这些要求,可能需要使用可定制的处理器结构。TTA就是这样一种可定制处理器结构。它类似
如今,工程师、科学家、企业家们都致力于事先预测出未来的发展及需求,针对各个目标制定相应的计划,并提供解决方案,以期改善某一领域。对未来事件的预测,在各个学科中均通过大量方
生物信息中的多序列比对问题,是建立系统发育树,基因和蛋白质的功能预测,探测序列之间的相互作用等的基础。但是,多序列比对问题是一个NP-hard问题,非常具有挑战性,对序列比
随着计算机技术的发展,计算机技术已得到越来越广泛的应用。研究科学的教育理念与合理高效的管理模式,开发职校教学管理系统,对于职校教学管理水平、提高教学质量有很大的现
多媒体技术的快速发展产生了大量的视频数据,人们对视频信息的使用已越来越频繁,但由于视频的长度及其非常丰富的内容使得很难对视频进行高效的浏览和查找。因此,我们希望建立一
任务调度是网格的关键技术之一,目标是将用户的任务请求合理地分配到网格资源上,达到任务高效运行和资源合理利用的目的。面向飞行器虚拟设计的航空专用网格中,涉及许多大规
自混沌理论出现以来,人们发现非线性现象产生于各种运动形式中,它几乎渗透于自然科学和社会科学的每一个分支。大多数情况下,复杂非线性动力系统不可能建立完备的数学模型,主要原
嵌入式系统是将先进的计算机技术、半导体技术以及电子技术与各个行业的具体应用相结合的产物。这个特点决定了它是一个具有技术密集、资金密集、高度分散、不断创新等特性的
随着通信技术、互联网技术和计算机技术的飞速发展,移动通信已经不再局限于单纯的话音通信,嵌入式技术与通信技术特别是与无线通信技术的结合,使得无线通信成为嵌入式Interne
学位