论文部分内容阅读
随着计算机技术、通信技术和网络技术的迅速发展,国际信息高速公路的建设与利用,为大规模的信息系统、图书馆系统的发展提供了环境和条件。目前,网络信息管理技术、数字化处理技术和数字式信息资源建设已成为国际竞争的焦点,各国都为此投入了相当的实力进行研究和开发。数字图书馆(Digital Library)这一新概念、新模式应运而生,并被视为二十一世纪信息产业主要的发展方向之一。从上世纪九十年代初发展至今,许多与数字图书馆相关的技术如OCR识别技术,全文检索技术的不断成熟,国际编码字符集Unicode标准及元数据标引规范Dublin Core标准的制定,都为数字图书馆的迅速发展提供良好的支撑。 目前我国藏文数字化的实现都是基于CodePage模式开发,用藏文编码区域覆盖汉字区域,这样很难实现汉藏并存检索,很少有适于Windows系统的藏文检索平台。藏文数字图书馆示范系统即为解决以上问题而建立开发的。 本文对实体资源的数字化,元数据标引,全文检索等关键技术进行详细论述。在ISO/IEC 10646/Unicode国际编码体系结构下,在藏文文字的构字特点和书写规范基础上,按照数字图书馆的开发流程,讨论了构建藏文数字图书馆的体系结构;重点对国际标准中藏文大字符集(垂直预组合)和小字符集(动态组合)两种编码方式的原理及需采取的技术方案作了深入探讨,用同义词关联检索解决了藏文两种编码模式的检索问题。提出首选大字符集编码模式,并简介应用实例。本文对Unicode、Dublin Core、XML标准作了较详细的论述,藏文数字图书馆示范系统也是严格按上述标准开发的。 本系统的建立旨在给藏文数字图书馆提供一个示范性、概念性的平台,希望能给其他少数民族文字数字图书馆建立提供参考或借鉴。