数字报刊及古籍全文检索系统设计与实现

来源 :北京科技大学 | 被引量 : 0次 | 上传用户:xtb0909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
报刊在我国具有悠久的历史,产生于唐代时期,直到现在仍然是信息传播的重要途径。在各个时期都为人们提供了大量的,及时的新闻,帮助人们了解世界,洞悉重大事件的发展变化,给人们带来了丰富的实用和娱乐信息。然而随着计算机技术的发展,人们对报刊所承载的信息及其传播形式的要求也越来越高了。   拥有五千年文明史的中华民族,创造了灿烂的文化,而这些见证了人类不断进步的历史需要现代人传承下去。古籍文章就成了不可或缺的文化传递工具。可是随着时间的推移和不同时期发生的历史事件,如战争等都给古文的保护和利用带来了损毁。   本文利用现代科学技术对报刊和古籍进行数字化后建立全文检索系统即点通全文检索系统,该系统的功能是实现对使用简体汉字书写的报刊和使用繁体汉字书学的古籍文章进行全文检索。系统建成后能够更好的保护这些珍贵的文献资料,使他们能被更有效的利用,使其为人类的发展贡献更大的力量。   本文的工作主要有两大部分。第一:设计并实现点通简体汉字报刊全文检索子系统,在该部分中提出了一种新的联合倒排索引结构,即以汉语分词为基础的单字符倒排索引结构;并设计了联合索引全文检索算法。第二:设计并实现了点通繁体汉字古籍全文检索子系统,在该部分工作中提出了一种新的古籍全文检索数据形式;并设计了螺旋递进全文检索算法实现古籍全文检索。
其他文献
随着计算机技术的飞速发展,工业生产和现代计算机技术的关系日益密切,将最新的计算机技术引入到传统的工业领域受到世界各国的广泛重视,我国作为工业大国,更加重视相关领域的研究
随着三维游戏、影视动画、多媒体等行业的高速发展,对计算机动画的需求量越来越大;同时对动画质量的要求也越来越高。因此,在计算机动画制作中,人工调整虚拟角色运动的工作方式已
随着超大规模集成电路工艺的发展,对于非易失性存储器容量的需求也越来越高。Nand Flash以其存储容量大,体积小,读写速率高等优势成为最理想的存储器件[16]。自九十年代初Nand F
中医学作为有中国特色的传统医学具有重要的社会价值。中医诊疗过程的个性化、复杂化特点以及中医知识体系的复杂结构使得中医传承在知识共享、知识交换以及知识融合等方面存
实时协同设计技术是计算机支持的协同设计的一个典型应用研究,它允许不同地点的设计人员、制造人员以及用户都能通过网络同步地参与设计,从而缩短产品开发周期、减少开发成本
基于人脸特征点定位的人脸图像处理,是近年来图像处理领域中发展较快速的一项研究课题,在国民经济中有着广泛的应用。随着近年来网络技术和手机应用技术的迅速发展,模拟艺术风格
使用计算机模拟各种自然现象,在计算机游戏、电影特效以及视景仿真领域中越来越流行。先前方法大多侧重于模糊态势的飘雪建模,真实性和实时性不能满足场景渲染需求。雪花作为
“软件人”是具有拟人智能的、生存并活动于计算机网络世界中的一类软件人工生命,是一种“虚拟机器人”,具有拟人属性、拟人功能、拟人行为和拟人结构。研究“软件人”的目的主
Web服务是一种面向服务的分布式计算模型,它提供一种平台独立、自描述、分布式的软件组件,是实现业务流程的一种松散耦合、应用互操作的平台。   单一的Web服务难以满足目前
这个时代,人类信息正在以空前地速度产生和数字化。这些信息的载体多种多样,如,新闻博客,微博,网页,科学论文,书籍,图片,声音,视频,以及各种社交网络。信息载体的多样化也直接导致了信息