基于FST技术修正中文词性标注的研究与实现

来源 :中国地质大学(北京) | 被引量 : 0次 | 上传用户：gengyunshe

【摘要】

：

自然语言理解又被称为自然语言处理或计算语言学,它是人工智能领域中的前沿难题之一。自然语言的识别和处理是人工智能研究的最重要的课题之一,也是人工智能研究的关键。其中

【作者】

：

方春平

【机构】

：

中国地质大学(北京)

【出处】

：

中国地质大学(北京)

【发表日期】

：

2010年期

【关键词】

：

FST 词性标注 HMM 命名实体 TokenList 正则表达式

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

自然语言理解又被称为自然语言处理或计算语言学,它是人工智能领域中的前沿难题之一。自然语言的识别和处理是人工智能研究的最重要的课题之一,也是人工智能研究的关键。其中在自然语言处理中的汉语词性标注是中文信息处理技术中的一项基础性课题,一个确切精准的词性标注对自然语言的理解有着极其广泛的意义,特别是在对输入文本进行句法分析、语义分析时,词性标注是一项必不可或缺的处理任务,因此,研究和实现汉语词性标注器具有重要的理论意义和实用价值。词性标注的方法主要有基于规则方法和基于统计的方法两大类。一般的情况下,为了达到更好的词性标注结果,往往都是采取基于统计和基于规则相结合。在基于统计的方法中,主要是采取隐马尔科夫模型(HMM),而基于规则的方法中系统中主要是采取有限状态转换机(FST)的方法,目前在自然语言处理上的应用上,FST方法在理论上还比较欠缺。在本文中就如何把FST应用到自然语言处理的词性标注上做了详细研究,并最终给出了实现的结果。最近几年来,在国际新一代计算机激烈竞争的影响下,自然语言理解的研究在国内得到了越来越多的重视,研究单位在逐渐增多,研究队伍也在逐渐壮大。目前在国内的研究中比较有代表的研究成果主要有机器翻译、语料库的研究、篇章理解研究、受限汉语研究等。但是不管怎样,所有的研究的前端都必须有词性标注这一项。

其他文献

三维可视化水平井模拟油藏地质导向系统的设计与实现

随着石油钻井技术的发展,过去由于油层薄,油层可开采属性差等原因无法进行商用开发的油藏,现在可以通过钻水平井的方式采油。水平井技术提高了采油产量,出油效率,使过去无法

学位

水平井实时导向地震数据体LWD/ MWD

复杂背景下实时人脸检测技术的研究

人脸检测是指在输入图像中提取人脸(如果存在)的位置、大小、尺度和姿态等信息的过程。人脸检测技术是计算机视觉与模式识别领域的一个前沿课题,在身份识别、感兴趣区编码、

学位

人脸检测肤色分割AdaBoost矩形特征复杂背景

视频监控中多目标检测与跟踪算法研究

近年来,视频监控技术在各个领域得到了广泛的应用。目标检测与跟踪是视频监控技术的关键,如何有效的进行多目标检测与跟踪是目前视频监控研究领域的热点和难点。论文针对遮挡

学位

多目标检测多目标跟踪重叠区域主色调直方图遮挡

基于IPv4/IPv6混合网络的SIP即时通讯研究与设计

随着多媒体技术和网络技术的不断发展,电信网、计算机网和有线电视数字网三大网络相互渗透、业务层上相互交叉,逐步走上了“融合”的道路。同时,随着网民数量的急剧增长,现有

学位

SIPIPv4/IPv6即时通讯协议无关性中间件异构混合网络

基于FST技术修正中文词性标注的研究与实现

其他学术论文