OA期刊在线集成平台与检索服务模式自动提取研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户：shi0206lei

【摘要】

：

目前DeepWeb是数据库领域研究的热点,开放存取期刊OA(Open Access)作为DeepWeb资源,以其优秀的学术共享理念得以迅速发展。但是OA期刊遍布互联网,“孤岛”现状日益严重,而传

【作者】

：

张现双

【机构】

：

燕山大学

【出处】

：

燕山大学

【发表日期】

：

2010年期

【关键词】

：

开放存取检索服务自动提取架构模型 HTML文档分析

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目前DeepWeb是数据库领域研究的热点,开放存取期刊OA(Open Access)作为DeepWeb资源,以其优秀的学术共享理念得以迅速发展。但是OA期刊遍布互联网,“孤岛”现状日益严重,而传统的搜索引擎难以对其隐含的数据建立索引。解决该问题的一条途径就是将不同开放存取资源的检索服务加以整合,建立一个虚拟的数字资源空间。但该途径面临的问题首先是缺少一种灵活、可扩展的开放存取资源检索服务在线集成平台的架构模型,其次是缺乏从OA资源的检索界面自动提取检索服务模式的方法。本文在上述几个方面进行了研究。首先,根据OA期刊的特点以及建立统一检索平台的功能需求,设计了一种灵活、可扩展的OA期刊检索服务在线集成平台的架构模型,并在模型中定义了各相关功能组件及其工作方式和数据交换接口。其次,本文在对大量OA期刊的检索服务界面进行分析基础上,采用分类的思想提出一种OA期刊检索服务模式的自动提取方法。先对OA期刊的检索表单进行大范围统计,根据特征对表单元素分类,并借助于HTML文档分析技术对分类后的属性单元进行深度解析,然后根据属性单元语义信息建立一种检索服务模式描述模型,并设计一种基于XML的检索服务模式存储结构。最后,在以上研究工作的基础上,通过在实现的原型系统上的实验,对检索服务模式的自动提取进行了分析和评价,同时平台从查全率,响应时间等方面分析了平台架构模型的性能。

其他文献

基于Java EE的开放式校园网IT运维平台的研建

伴随着近年来中国互联网的飞速发展,我国校园信息化的步伐也在不断加快,投入不断增多。校园网在日常教学、生活中的作用日益明显,具体表现在用户基数的迅速增长、校园网内资

学位

IT运维平台SOAWeb服务Java EE

基于移动搜索的查询扩展算法研究

随着计算机网络与通信技术的快速发展,移动搜索以其便利性、准确性、个性化等突出优点备受关注。如何利用移动设备从海量信息中检索出有用的信息已成为一个非常重要的研究课

学位

移动搜索信息检索词语共现查询扩展上下文

基于ZISC神经网络芯片架构模拟的字符识别研究

ZISC（Zero Instruction Set Computer——零指令集计算机）神经网络芯片，是目前国外先进、成熟的神经网络芯片，已经被广泛应用于产品检测、物体识别、字符识别、图像跟踪等领域。

学位

零指令集计算机零指令集计算机神经网络神经网络模式识别模式识别架构模拟架构模拟

基于构件的柔性Web用户界面模型

在Internet时代背景下,应用环境和用户需求越来越易于发生变化。如何使Web用户界面适应和满足用户需求变化和多样性要求,已成为Web软件业亟待解决的热门问题之一。为了使Web

学位

柔性软件思想构件柔性界面构件柔性Web用户界面模型领域工程

面向服务的工作流管理系统的设计与实现

工作流的概念起源于生产组织和办公自动化领域,其目的是通过将工作分解成定义良好的任务、角色,按照一定的规则和过程来执行这些任务并对它们进行监控,达到提高工作效率、降

学位

工作流工作流管理系统Web服务SOASOAP

OA期刊在线集成平台与检索服务模式自动提取研究

其他学术论文