生物信息文献数据库构建与软件Web自动发布

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:ww4102001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的迅猛发展,信息逐步数字化、网络化、全球化。如何高效、准确地利用互联网上的有用信息已成为人们关心的课题。对于生物信息学研究者来说,能否充分利用国际国内已有的文献数据库、构建各机构内部使用的文献数据库,这是能否有效开展研究工作的基本保障。另一方面,随着人类基因组计划的完成,已经涌现了大量旨在从生物数据中分析和挖掘有关知识的生物信息软件,若这些软件能被充分地共享,则将有效推动生物信息学研究人员的研究工作,由此,对这些软件进行Web发布以提供共享服务也就变得日益重要。针对在建设文献数据库时文献索引信息需手工录入、上传文献效率低的不足,研制了PDF文献索引信息自动抽取工具。通过对PDF文件结构和信息抽取原理进行分析,提炼和总结了生物信息领域中大量重要期刊的PDF文献索引信息的特征和规律,并制定出抽取规则,根据抽取规则,对文件进行语义信息分析,实现了该领域的PDF文献索引信息的自动抽取,提高了文献上传效率。在生物信息文献数据库中对该工具进行了测试。测试证明,系统能实现单个文献和批量文献的自动上传,使生物信息文献数据库素材的收集变得方便。通过分析元搜索引擎的特性,将元搜索引擎技术应用到文献的搜索上来,开发了一个文献元搜索引擎,它包括界面、调度、显示三个核心功能模块,选择多个著名的学术文献搜索引擎和数据库为目标搜索源,克服了单个文献数据库中存在的文献数量有限、覆盖面窄和有效检索率低等问题,为进一步整合分布式、异构生物信息数据库打下了基础。针对目前生物信息软件发布过程中,存在重新设计和制作网页、人工发布软件等重复性工作,设计了基于模板技术的生物信息软件Web自动发布系统。采用B/S模式、模板技术以及Java相关技术,设计和实现了一个生物信息软件Web自动发布系统,能方便地将本地软件发布到Internet,提供软件的在线计算、实时下载等服务,提高了发布生物信息软件的工作效率。
其他文献
近年来,互联网中的VoIP业务得到广泛应用,通话模式已由PCTOPC的方式逐渐发展为PCTOPHONE或者PHONETOPHONE,给电信运营企业的传统电信话音业务带来了新的市场的同时,也带来了巨大
随着Internet发展进程的加快,网络信息资源在数量上呈爆炸式增长。现有的搜索引擎大多是基于文本和关键字的通用检索,存在查询方式单一、查准率低、用户满意度差等诸多问题。为
随着无线通信技术及移动定位技术的高速发展,基于位置的服务(locationbased services)获得了广泛的推广及应用。通过基于位置的服务,人们可以随时随地获得需要的信息。然而,
近年来,Agent、多Agent系统理论以及与其相关的强化学习等理论受到越来越多研究人员的重视。随着单Agent学习方法的研究成功,人们也将注意力投向了更为复杂的多Agent系统。在很
人脸识别是模式识别领域中一个相当困难而又具有重要理论价值和实际应用价值的研究课题,同时它也是生物识别领域中的热点课题。人脸识别的研究具有广阔的应用前景,可以广泛地用
Adhoc网络是由一组移动节点组成的自组织网络,具有高度的灵活性和抗毁性,因此一直倍受军方和学术界的关注。近年由于移动计算技术的进一步发展、便携式笔记本以及各种手持通信
软件复用技术是软件工程研究的重点之一,作为提高软件生产率和软件质量的有效方法已日益受到软件工程师们的重视。基于构件的软件开发(Component-Based Software Development
对等网(Peer-to-Peer,P2P)技术是一种构筑在现有因特网基础之上、以文件共享为初始目的而产生的一种覆盖网技术,目前该技术已被广泛应用于对等计算、协同工作、资源搜索与共享
下一代网络和新一代业务支撑环境有利于快速、灵活的业务开发和部署。应用服务器是新一代业务支撑环境中一个主要的功能实体,它通过开放的协议或API与软交换设备交互来间接地
随着IP技术的发展,基于IP技术的各种应用变得越来越广泛。不但在计算机界,而且在通信界也越来越重视对IP技术的研究。为了满足人们日益增长的对通信网络的需求,经过多年的努力,产