基于句尾词性的藏语句子边界识别方法

来源 :青海师范大学 | 被引量 : 0次 | 上传用户:tc_b074220
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
藏语自然语言处理是一门自然科学与社会科学的交叉学科,集藏语语言学、计算机科学、数学、逻辑学和心理学,研究人与人、人与计算机之间交流的一种语言问题。相对而言藏语自然语言处理研究起步较晚,刚开始的研究集中在藏文字的层面,较长的时间内停留在藏文字编码、字库建设和藏文字处理等研究上,随着国家与国际标准制订才得以确定。随着计算机技术和网络技术的迅猛发展,藏语自然语言处理得到了快速发展,近年来藏语自然语言处理的研究从字的层面逐步过渡到了词和句子的研究,开发了藏文分词系统和标注系统,统计出了藏文字、词的频度,取得了一系列创新性的研究成果。以上研究成果为藏语句子研究奠定了坚实的基础,目前已有科研单位及学者开始研究藏语句子的特点、属性、成分等,这些研究的前提是要能够确定藏语句子的边界。藏语句子边界识别研究技术比较成熟后才能够准确地研究藏语句子的特点、成分及句法分析。藏语句子边界识别研究对词法分析、句法分析、语义分析、语用分析及语料库建设等领域有着非常重要的理论价值。本文通过搜集和阅读大量的文献资料,分析了藏语句子的概念以及特性,统计分析了藏语句子的结束形式以及藏语句尾词性和藏语标点符号系统,研究了藏语句子边界的词性规则,提出了基于句尾词性的藏语句子边界识别方法。该方法简单有效,在含35126句的语料中随机抽取4133句作为测试集,对本文提出的识别方法进行了测试,其准确率达99.98%,召回率为99.98%,F1为0.9998。
其他文献
随着计算机视觉技术的发展,运动视频目标跟踪技术已经成为武器制导、模式识别,计算机视觉等领域的重要课题。由于运动视频目标跟踪技术在军事和民用领域都有广阔的应用前景,国内
时间序列预测在生活和工农业生产中扮演着越来越重要的角色,它的应用遍及很多领域,极大地推动了各个领域的发展。支持向量机(SVM)是基于统计学习理论的方法,由于其具有全局最优
随着移动互联网的快速发展,基于位置的服务在某些领域得到广泛应用,如:旅游服务、车辆导航等。人们在享受服务的同时,新的问题出现了:位置隐私泄露。位置信息与人们的日常生
近年来,随着电子信息,通信以及计算机科学的快速发展,脑电信号处理所需要的理论和技术也越来越完善,因而脑机接口(Brain.Computer Interface,BCI)的研究开始成为热点。脑机接
当前国内的中小型软件开发公司在软件开发过程中,普遍存在着项目管理困难的问题。同时,项目管理人员还面临着项目资源有限、计划变更频繁、反应迟缓等问题。当前的项目管理软
近年来,随着计算机技术的飞速发展和芯片制造工艺的不断进步,嵌入式实时操作系统ERTOS(Embedded Real—Time Operating System)逐渐渗透到科学研究、工程技术等各个领域,其性
学位
随着全国数字电视整体转换工程的推进,数字电视的平板化、大屏化和高清化,地面数字电视信号的开播、融合芯片的量产,以及日益丰富的高清互动应用,新型互动数字电视已深入到千家万
随着因特网的普及与发展,XML语言被普遍用于异构信息和异构平台的数据交换和数据共享。为了推动XML数据查询和处理的标准化,国际万维网组织W3C组织发展了XQuery语言,并将其作
随着通信技术的高速发展,降低传输中的数码率成为一项关键问题。为了降低传输的费用,必须对采用模/数转换技术得到的语音信号进行压缩。这也就促使了语音压缩编码技术的不断