面向工业生物技术领域的集成信息检索系统的研究与实现

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:jkdjzzg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
工业生物技术知识环境建设及其e-Science应用是中国科学院信息化专项项目,本文即是以工业生物技术知识环境建设为项目背景展开。   工业生物技术(Industrial Biotechnology)作为新兴的绿色化工产业,可应用于大规模生产人类所需的化学品、医药、能源、材料等,是解决人类目前面临的环境问题,资源、能源问题及可持续发展问题的有效手段。工业生物技术被誉为生物技术发展的第三个浪潮,日益受到科研单位,政府,工业企业的重视。随着工业生物技术研究的深入,学术界,产业界已经积累了大量与工业生物技术相关的生物信息数据,文献数据,企业产品数据等多种多样的信息。这些信息地址分散,格式不同,访问方式各异,形成了众多的信息孤岛,对于工业生物技术的研究工作造成了困难。因此需要一个一站式,集成化的信息检索平台。   本文即根据如上需求提出建设一个工业生物技术领域的国内外数据资源,网络信息资源的集成信息检索系统。系统主要由工业生物技术领域数据库信息的检索和工业生物技术领域互联网信息的检索两个功能模块组成。对于工业生物技术领域重要的数据库我们采用基于数据仓库的集成检索模式,文中详细阐述了数据仓库的设计模型,建立过程,元数据管理及ETL工具的设计等方面内容。在工业生物技术领域互联网信息检索我们采用基于向量空间模型的全文信息检索技术,通过应用Lucene检索框架,在系统信息的采集,分析,索引的构建,检索评分等方面,都将工业生物技术领域特点与相关信息技术相结合。   本文在行文中着重从系统的设计及实现策略方面阐述了整个系统的构建过程,文末对信息的整合方式,集成信息检索的模式进行了分析,并就一种基于Hibernate Search的系统优化方案进行了研究,对系统的进一步发展做出了展望。通过面向工业生物技术领域集成信息检索系统的建设,形成了以信息集成与服务集成为特征,以达到知识的共享为最大目的,实现对由互联网连接起来的各种信息及数据的集成检索,服务于新型科研模式的信息检索系统。
其他文献
网格参数化指为网格模型表面建立与平面或球面等参数域的函数映射,从而建立原模型的顶点与参数域上顶点的对应关系。由于网格参数化为离散、无序的网格模型提供了一种有序的、
操作系统安全是计算机系统安全运行的基础,如何构建安全操作系统一直是安全研究领域的重要课题。安全体系结构是安全操作系统的核心结构,对安全操作系统的开发具有指导作用。本
随着IPTV业务的迅速发展和用户规模的扩大,IPTV作为一项重要的电信增值业务如何融入到下一代网(NGN),成为人们关注的焦点。IP多媒体子系统(IMS)是构建统一多媒体业务的通用平
网页信息抽取是指从网页中(半)自动获取用户感兴趣的信息,其在信息检索、舆情监测等应用中非常广泛。然而现有的研究只注重精确度、召回率等传统指标,忽略了分析各类特征在抽取
基于QoS的主动兴趣管理技术将QoS引入主动兴趣管理系统,为用户提供可靠的服务保证,一定程度上提高了分布式虚拟环境的可扩展性。随着用户对于协作要求的越来越普遍,分布式虚拟环
随着科学技术的发展和进步,人类航天活动也越来越频繁,深空探测越来越受到各个国家的重视,近年来我国对深空探测也加大了投入。开展深空探测对于科技进步和人类文明的发展有着促
学位
数据库入侵检测技术是数据库安全的重要组成部分。目前的入侵检测系统采用模式匹配方法,虽然对已经存在的攻击具有很高的检测效率和正确率,但对很多未知的入侵攻击行为和方法
当今,Web应用已经成为人们获取信息、交流情感、开展工作、处理日常事务等的重要工具。它们改变了、并正在改变着人们的生活方式。为确保Web应用拥有者和使用者的利益必须开发
随着计算机与信息技术的发展,数据挖掘技术已经广泛应用到人工智能、模式识别、生物信息等许多领域。当前,复杂类型数据的挖掘需求上升,专家学者开始关注这方面的新应用和理
复杂网络可以用来描述社会关系网络、生物网络、通信网络、网页链接关系等真实网络。从20世纪90年代,复杂网络概念提出之后,很多不同领域的研究者都开始关注复杂网络的研究,但是