基于Bi-LSTM-CRF模型的维吾尔语词干提取的研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:gandianci20
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词干提取是维吾尔语自然语言处理中的基础性研究,其提取质量直接影响其他任务的性能。但目前维吾尔语词干提取研究存在过度切分、不切分和歧义切分等问题,这些问题导致词干提取质量不高,对后续任务的性能影响较大。因此该文提出了基于Bi-LSTM-CRF的维吾尔语词干提取模型,将字符作为最小切分单位,选取维吾尔语字符特征、音类特征以及语音特征为候选特征,结合模型进行实验。实验表明,该文提出的Bi-LSTM-CRF模型在维吾尔语词干提取任务上,F1值达到了88%,在融入手工提取的候选特征之后,F1值提高了1.8个点,有效
其他文献
Kahman给出了相邻的矩形域上的Bezier曲面及相邻的三角域上Bezier曲面之间GC2连续条件.利用相邻矩形域上的Bezier曲面之间的GC2连续条件及Bezier曲面的高阶编导数,得到了相邻
用RV20旋转粘度计和地层条件毛细管流变仪测量了不同油田脱气稠油的流变性,研究了温度对稠油流变性的影响,建立了对应于不同温度的流变模式和适切的本构方程,指出对于稠油存在某一临
汉盲转换是指将汉字文本自动转换为对应的盲文文本,其在盲文出版、盲人教育等领域具有重要应用价值,但当前已有系统性能难以满足实用需求。该文提出一种基于汉盲对照语料库和
通过对影响音视频产品安全测试的主要条件分析,帮助检测人员更好地理解这些主要测试条件,并在音视频产品的安全检测中,能对这些条件进行最不利的组合,确保产品达到标准的安全
2019年5月3日至5日,第十六届全国自然语言处理青年学者研讨会(YSSNLP 2019)在海南琼海顺利召开。本次研讨会由中国中文信息学会主办,海南大学承办,近200名代表参会。
套管磨损在深井,超深井,大位移井和水平井的钻井和修井期间是一个不容忽视的问题,引起套管柱磨损的因素很多,本文着重概述了钻杆柱的旋转及起下钻,井壁狗腿严重度和泥浆成分等几种
文章主要介绍了索威制造执行系统的特色创新、网络结构、系统配置、应用系统体系结构,详细介绍索威制造执行系统的主要功能:
针对目前国内编辑部现状,构建了一种基于Windows95/98的简易、实用的编辑部局域对等式(Peer to Peer)网络。论述了这种网络简单、经济、实用的设计思想,对编辑部、办公室人员如
现有的词语语义相似性计算主要包括基于向量模型以及基于词汇分类体系两类方法,但这两类方法都存在自身的缺点。向量模型所依赖的文本共现中的上下文信息不等同于真正意义上
英文中单词有大小写之分,如果使用不规范,会降低语句的可读性,甚至造成语义上的根本变化。当前的机器翻译处理流程一般先翻译生成小写的英文译文,再采用独立的大小写恢复工具