论文部分内容阅读
创建语料库的目的在于更加便捷地对语言进行统计分析处理。本文主要依照《五部遗教》创建了语料库,又分别为五个章节单独创建了参考语料库,以此对词汇的类型和数量做出分析和统计。全文共分六个部分,包含结语。第一章即前言中,综述了本文的选题目的和意义、《五部遗教》的研究现状、相关研究方法以及版本等各方面的情况;第二章简明论述了莲花生大师的生平事迹、《五部遗教》的总体内容及其出处与特点;第三章首先由语料库入手,对语料库的定义、发展历程、创建语料库的方法与技巧进行了简单论述,进一步探讨了藏族古今语言学者对词所设的概念和定义以及区分的类别,并就藏文信息处理对《五部遗教》中词汇做出的分类、区分标准、在语料库中如何进行标注等问题以多拉老师等人提出的“信息处理用藏语词类标记集和藏文分词规范”进行了阐述。第四章第一节中对《五部遗教》语料库中的词汇采用“信息处理用藏文分词规范”进行分类,区别出名词、动词、形容词、量词等多种类型,对其各自在整个语料库中出现的频率以及所占的比例做出了统计,进而研究了五个章节中各种词类的数量和覆盖率,第二节中统计了《五部遗教》各个章节中出现的词汇、标点符号的总数、先后出现的频率,并且从语料库中出现次数最多的一到十音节依次记录了累计频次,探究了这些字符在《五部遗教》中所占的分量,此外还统计了《五部遗教》中其他标点符号和梵文的数量。第三节依据《五部遗教》语料库,举例分析了各种词类的构成。第五章中对《五部遗教》中出现的人名、地名以及出现的频率进行了统计分析。