基于规则和统计的日语分词和词性标注的研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：JK0803zhushuangyi

【摘要】

：

日语分词和词性标注是以日语为源语言的机器翻译等自然语言处理工作的第一步。该文提出了一种基于规则和统计的日语分词和词性标注方法,使用基于单一感知器的联合分词和词性

【作者】

：

姜尚仆陈群秀

【机构】

：

清华大学信息科学与技术国家实验室,清华大学计算机科学与技术系

【出处】

：

中文信息学报

【发表日期】

：

2010年01期

【关键词】

：

人工智能机器翻译日汉机器翻译系统日语分词日语词性标注联合分词

【基金项目】

：

国家863计划重点资助项目(2006AA010109)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

日语分词和词性标注是以日语为源语言的机器翻译等自然语言处理工作的第一步。该文提出了一种基于规则和统计的日语分词和词性标注方法,使用基于单一感知器的联合分词和词性标注算法作为基本框架,在其中加入了基于规则的词语的邻接属性作为特征。在小规模测试集上的实验结果表明,这种方法分词的F值达到了98.2%,分词加词性标注的F值达到了94.8%。该文所采用的方法已经成功应用到日汉机器翻译系统中。

其他文献

高校图书馆管理创新探讨

在现代高校建设及发展过程中,高校图书馆已经成为十分重要的组成内容,在高校中占据十分重要的地位。为能够使高校图书馆得以更好运行及发展,图书馆管理属于十分重要的一项任

期刊

高校图书馆管理创新

热灭活的隐球菌对小鼠隐球菌脑炎影响的研究

新生隐球菌是一种具有荚膜的酵母真菌，能导致全身各器官的感染，主要侵犯中枢神经系统，其中严重威胁生命的隐球菌性脑膜炎占80%。随着使用免疫抑制剂的增加及艾滋病在全球的蔓延，

学位

新生隐球菌灭活细胞因子逆转录—多聚酶链反应

用起动继电器诊断起动系统故障

<正> 发动机起动后,若未及时放松起动开关,起动机仍继续工作,将造成单向轮长时间滑磨而加速损坏;发动机起动后,若误将起动开关再次接通,起动机又进行工作,则将使驱动齿轮与高

期刊

继电器线圈常闭触点系统故障指示继电器

“说课”应当“说”以致用

期刊

应当大纲

低渗特低渗油层压裂增产改造经济评价研究

我国低渗透油气具有很大的开发潜力,如何尽快高效开发未动用的低渗油气藏,对保持我国石油工业的持续稳定发展具有重要作用。水力压裂是目前开发低渗透油藏的有效方式之一,本

学位

低渗油层压裂改造经济评价

慢性丙型病毒性肝炎患者I型树突状细胞、淋巴细胞亚群的特点及临床意义

树突状细胞(DC)是一种功能最强的专职抗原提呈细胞(APC)，其对抗原进行捕获、加工，处理后提呈给MHC-Ⅰ、Ⅱ类分子，诱导活性T、B淋巴细胞的增殖，在调节特异性免疫反应中起决定性作

学位

慢性丙型肝炎树突状细胞体外培养淋巴细胞亚群流式细胞术

离心压缩机喘振原因分析与控制探析

随着社会经济水平的不断提高,工业生产领域也在不断进行改革,通过引进新设备、新技术,显著提高了生产水平,推动了社会的进步与发展。其中,离心式压缩机的应用范围较为广泛。

期刊

离心式压缩机喘振原因控制

泵业第一家源头工厂KSB旗舰店上线阿里巴巴

2016年7月11日，世界第一个泵行业阿里巴巴工厂店KSB旗舰店上线开业。作为一家老牌的跨同企业，具有145年历史的泵阀界全球领先的制造商，KSB与时俱进，在每一个发展的节点都紧跟市场

期刊

阿里巴巴泵行业旗舰店工厂源头与时俱进制造商

微生态技术让水生态修复渐入“佳境”

2015年，海南省海口市在全国邀水务企业对该市黑臭水体治理进行中试实验。北京佳业佳境环保科技有限公司凭借着独特的微生态活水直接净化工艺，在38家竞争者中胜出。作为一种原位

期刊

水生态修复生态技术水体治理净化工艺中试实验环保科技净化技术专用设备

住院精神病病人自杀危险因素评估及护理对策

[目的]重新评估住院精神病病人自杀危险因素,并提出相应的护理对策。[方法]对2003年—2005年3000例住院精神病病人进行调查,对自杀的30例进行回顾性评估,分析其自杀原因或主

期刊

精神病自杀危险因素护理

基于规则和统计的日语分词和词性标注的研究

与本文相关的学术论文