基于NN-LSVM的日语依存关系解析

被引量 : 0次 | 上传用户:wangwei0101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
日语依存关系解析是基于日语依存文法,确定句子中各个文节间的依存关系。它是日语句法分析的一个重要的组成部分,在日语机器翻译、句子分析等许多领域有着重要的作用。因此,在日语自然语言处理领域,依存关系解析的研究具有重要的理论和实际意义。本文主要研究在大规模标注语料库支持下的基于NN-LSVM的依存关系判定方法。 日语是一种结构比较紧凑的语言,依存关系主要发生在相邻的两个文节之间。因此,本文采用了基于组块的文节逐步应用算法来控制解析过程,即在依存关系的解析过程中,仅仅关注直接相邻的文节间是否具有依存关系,而不是考虑所有的文节对。这样可以有效的控制依存候选的数量,减少了解析的运算量,提高了解析的精度和解析的速度。 本文采用SVM(Support Vector Machine)模型利用标注好的语料生成一个分类器,以此来判断两个文节间是否具有依存关系。提高SVM模型解析精度最好的方法是增大训练集的规模,然而,随着训练集规模的增大,训练时间会大幅度的增加,解析速度也会变的缓慢。为了克服训练集规模增大带来的影响,本文在SVM基础上提出了一种基于NNLSVM对大规模训练语料进行修剪的日语依存关系解析方法:在使用SVM训练得到分类器之前,使用LSVM和NN方法删除那些对分类没有作用的,甚至起反作用的训练样本,然后再经训练得到最终的分类器,以此用于依存关系的解析。 用京都大学语料库进行测试,文节的解析精度达到了89.23%,句子的解析精度达到了47.82%,解析速度为0.8秒/句。实验结果表明本文提出的方法能够用于解析日语的依存关系,并且可以取得较好的解析精度和解析速度。
其他文献
由于城市商业综合体建筑存在"整体空间形态松散"、、连接空间基面单一"、"交往空间活力不足"等方面的问题,我们需要时城市商业综合体建筑空间进行集约化设计,以达到节约占地
<正>TPP跨太平洋伙伴关系协议(Trans-Pacific Partnership Agreement,TPP),也被人称作"经济北约"。TPP参与国12个,是一份就货物、服务、知识产权贸易和投资等相关领域给予互
我国推行的政府采购制度是在具有非对称信息的市场下进行的,而市场信息的不对称性容易使采购活动中出现“逆向选择”、“道德风险”和“暗箱操作”等问题。本文从非对称信息
初中物理概念是物理基础知识的重要组成部分,是完善物理理论的基础和前提,物理概念的教学是初中物理教学的重点和难点。本文介绍了概念在初中物理学习中的重要性。
目的:探讨隐球菌性颅内肿块性病变MRI的特征性表现。方法:总结分析12例经病理或生理学检查确诊的隐球菌性颅内肿块性病变患者的MRI结果。结果:12例患者中,胶样假性囊肿5例(42
随着网络技术和通信技术的突飞猛进,人们不仅对家居的自动化和信息化程度要求越来越高,而且对家用设备控制的灵活性以及对外部信息获取的方便性提出了更高的要求。这些要求的
目的用MR动态增强检查技术分析甲状腺占位性病变动态增强特点,探讨良、恶性甲状腺病变的增强模式。材料与方法搜集手术病理证实的甲状腺占位性病变42例(男10例,女32例),其中
目的:穴位自血疗法治疗手部湿疹临床疗效的观察。方法:将临床诊断为手部湿疹的40例患者随机分为两组各20例,对照组口服西替利嗪和复方甘草酸苷片剂,外用糠酸莫米松乳膏,治疗
遗传这部分内容是历年高考的重点和热点,是考查推理能力和综合分析能力最好的生物素材。如何让学生在较短的时期内有效地掌握解决遗传问题?对习题进行归类,找出解题思路、方
利用美国A spenTech公司的APC软件,在对高密度聚乙烯(HDPE)装置进行测试的基础上,开发设计了HDPE装置的先进过程控制方案,建立了产率、产品质量、浆液浓度及冷却系统等控制器