哈萨克语句法分析重排序技术研究

来源 :新疆大学 | 被引量 : 0次 | 上传用户:liongliong584
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言处理研究主要有词法分析、句法分析以及语义分析,句法分析是哈萨克语现阶段的研究对象,在句法分析之前已经完成了词干提取、词性标注以及组块的研究工作,句法分析的研究也取得了不错的成果。本文主要对哈萨克语句法分析进行研究。PCFG模型进行句法分析过程中由于假设独立性太强,能捕捉到句子粗粒度的信息,即捕捉句子结构信息能力较强,但是语言是复杂的,句子中的语法结构并不是完全独立的,在进行句法分析阶段,词汇信息是比较重要的因素。该方法忽略了词汇信息对于句法分析的重要性,因此在句法分析中消歧能力有限。在此基础上,本文提出了使用感知机进行重排序的方法,感知机可以捕捉句子细粒度的词汇信息,从而弥补PCFG模型的这一缺陷。重排序的方法对哈萨克语句法分析是有效的,因此在本文中主要采用感知机的方法对候选解析树进行重排序。具体工作如下:首先使用最大熵模型对哈萨克语进行词性标注,实验验证不同的特征对词性标注的影响,并选择最佳的特征模板进行词性标注。其次进行哈萨克语的句法分析,本文中的哈萨克语句法分析重排序技术研究分为两个阶段:第一阶段分别使用PCFG模型和词汇化的模型进行简单的句法分析,并将这两个基础模型进行句法分析的解析效果进行对比。该阶段产生的句法分析候选树作为第二阶段重排序过程的输入,对哈萨克语进行进一步的句法分析。第二个阶段是重排序阶段,这个阶段使用感知机的算法进行重排序。该方法弥补了第一阶段句法分析中存在歧义现象的缺陷,在句法分析过程中能够获取句子中细粒度的词汇信息,并对基础模型产生的候选解析树进行重排序。感知机重排序的主要思想是对基础模型得到的候选解析树加入词汇信息以及细粒度的特征重新计算候选树节点得分,达到粗略的句法分析方法和细粒度的重排序方法相结合,从而提高句法分析效果。实验表明哈萨克语句法分析重排序方法是可行的。
其他文献
随着微机电机械系统MEMS的发展,元器件也逐渐趋向小型化、薄型化发展趋势,对微操作技术提出了越来越更高的要求。微小物体的拾取、姿态调整和释放是微操作中的重要环节,由于
图像分类是计算机视觉领域的热门研究方向,也是人工智能发展的重要基础。随着智能化移动端的快速普及,推动了全球移动数据流量的大幅度增长,与此同时计算机性能的不断提升,尤
常见的匹配追踪算法(MP)是一种非常典型的迭代贪婪算法,它实质上是一种为了减小求取最优解时所遇到的困难进而转求取次最优解的一种方法。该方法最关键之处就是在迭代的策略
苏联伟大卫国战争(1941-1945)是俄罗斯历史上乃至世界历史上极为光辉的一页,苏联女性为战争的胜利作出了重要的贡献。笔者选取了纪实性文学作品的《伟大卫国战争中的苏联女性》(СоветскиеженщинывВеликойОтечественнойвойне)第二章的前两节作为翻译材料。纪实性文学作品兼具有纪实性和文学性两个特征,译者不仅要将真实的历史信息准确地介绍给读者,同时还要引发目的语读者
本研究基于自我决定理论,采用定量研究方法研究了安徽农业大学经济技术学院计算机专业本科生的学习动机对学习成绩的影响。由于学生的学习动机与学习成绩没有直接关联,本研究把学生的基本心理需求满足、学习自我效能感和课堂参与作为中介变量,通过构建因素之间的关系模型解释学习动机与学习成绩之间的关系。本研究的研究对象为安徽农业大学经济技术学院417名在校计算机专业本科生。采用通径分析的方法研究因素之间的关系。本研
在无线通信网络中,无线中继技术已然成为有效扩展无线通信覆盖范围和实现协作分集的关键技术。然而,该技术由于中继容量和使用寿命有限而受到了极大地限制。考虑到无线射频(R
无线传感器网络的广泛部署,为工业生产、环境保护、智能家居等研究领域提供了更先进的解决方法。近年来,由于资源枯竭等问题,太阳能作为一种资源丰富、方便获取的清洁能源开
远程教育是当代教育领域中不断演化出一种新的教育形式,在互联网教育平台的推动下使得这种教育形式蓬勃发展。本文所研究的人眼定位算法为远程教育系统中监测模块提供了人眼
磁力齿轮相较于机械齿轮,可以实现无接触传动,具有无摩擦、免维护并且可以实现过载保护等优点。但现有磁力齿轮的内、外转子上均安装有永磁体,当应用于电动汽车的主减速器中并处于高速和重载工况下时,其转子上的永磁体材料因脆性大抗拉极限强度低,受到高速旋转产生的离心力以及工作载荷的共同作用会有发生碎裂的风险。为了解决上述问题,本文根据游标磁阻电机的工作原理,提出了一种车用磁阻式磁力齿轮减速器。该磁阻式磁力齿轮
增强现实是计算机视觉、计算图形学等领域中的一个热点研究方向,增强现实系统通过将计算机生成的虚拟信息融合显示到真实环境中,可以增强用户对真实环境的感知与交互能力。实