论文部分内容阅读
现有网络时代,越来越多的人在使用信息的时候,面临着海量的搜索结果,相关与不相关的页面混杂在一起,检索效果差;或是有时得不到任何搜索结果;或是漏掉一些关键的结果;亦或是需要人工将有用信息组织起来的情况。
随着网络语义技术的不断发展,语义网信息发布的标准形式——关联数据技术被广泛的推广和应用。关联数据严格采用HTTPURI作为事物的唯一地址,使真实世界全面映射到网络世界,并全面支持RDF数据格式,使万维网资源可以将真实的世界完美的诠释。人们旨在利用关联数据,在现有万维网的基础上,建立一个可以映射世界上所有事物的数据网络,通过将所有事物及事物间的关系表述为机器可以读的方式,使互联网成为一个知识链接的网络,使人类在更大范围内,准确、高效的查找、分享、并且利用这些具有关联关系的数据、信息和知识。
对NSTL来说,同样面对着科技文献资源数字化这样的一个现实问题,NSTL包含了海量的科技文献,图书信息等数据,是我国科技工作者不可或缺的一个重要的知识获取平台,面对网络时代数字化的变革,NSTL怎样才能更好地为广大的NSTL使用者提供全面的文献资料,全方位的个性化服务,是NSTL未来发展的重中之重。
因此,NSTL需要将海量的数据信息以关联数据的标准发布,并研究在关联数据背景下海量数据的应用,服务问题,来更好的服务用户,满足用户的知识需求。
本课题的目标是将NSTL的海量数据转化为关联数据,并在此基础上构建应用,以实现将NSTL海量科技文献信息资源进行有效组织、深度揭示和知识化关联,并加深NSTL对国内广大的用户群体和情报机构的服务深度和服务能力。
课题通过前期调研,总结,分析NSTL的数据和发展现状,以及关联数据的产生,发展和应用状况,提出了适合NSTL关联数据构建与应用研究的一整套方案:关联数据及NSTL背景介绍——NSTL关联数据构建——NSTL关联数据发布——NSTL关联数据应用——NSTL及关联数据发展前景展望。文章制作了实验模型,成功证明了试行方案的正确性和可行性。
对于NSTL关联数据的构建,本课题选择的方法是:采用关系型数据库直接到RDF数据映射的方法来实现数据的转换和应用。课题经过仔细调研,选用了D2R这个关联数据发布工具来进行NSTL关联数据的构建。
本课题在关联数据构建之后,结合NSTL的服务模式和数据特点,利用开源工具JAVA等,构建了适合NSTL资源组织的几类应用——语义关联应用,智能查询应用,知识组织应用。这些应用将关联数据的特点和优势深度发挥,方便了NSTL服务平台的广大使用者,同时为未来NSTL语义化的发展提供了参考。
课题最后结合国内外最新的语义工具及技术手段,对NSTL以及关联数据的发展前景进行了展望。
文章针对NSTL资源现状,开展了关联数据的应用技术研究,探索了对NSTL资源实现知识组织的一条有效技术途径,对文献资源建设与服务领域具有很好的借鉴作用,具有理论和实践指导意义。
本论文的创新之处在于;一是深入分析了关联数据的实现技术及应用前景;二是合理设计了NSTL科技文献资源构建为关联数据的技术路线;三是基本勾画了基于关联数据的NSTL服务模式;四是采用了虚拟的RDF数据实现方式。