词干提取相关论文
我们为蒙古语词法分析建立了一种生成式的概率统计模型。该模型将蒙古语语句的词法分析结果描述为有向图结构,图中节点表示分析结......
本文对维吾尔语名词形态结构进行研究,并构造了名词有限状态自动机(FSM).然后针对自动机的缺陷使用最大熵模型给有限状态自动机加......
维吾尔语是黏着语,具有比较复杂的形态变化.不管是维吾尔文词典的编纂,还是搜索引擎的开发,或机器翻译系统的研究,都需要对已变形......
结合理论和实验比较分析用于词形规范的词形还原方法和工具。归纳现有词形还原方法的主要分类,分析各类方法的特点和不足。介绍7种......
伴随着网络的发展,文本分类技术成为信息处理领域中重要的研究方向,通常用于处理和组织大量文本数据。蒙古语在中国来说是少数民族......
词是语言中最小的能独立运用的单位,是自然语言处理的基本单位。词法分析是自然语言处理的一个基础课题,其主要研究内容是进行词语......
自然语言处理是计算机科学领域与人工智能领域中的一个重要的方向,它能实现人与计算机之间用自然语言进行有效沟通的各种理论和方法......
维吾尔语具有形态丰富性、黏着性和数据稀疏性等特点,处理技术和英汉等热门语言有着较大差距并且未能满足新疆地区发展需求。形态......
命名实体识别(Named Entity Recognition,NER)是根据各种识别和搜索技术识别输入的文本对象中的人名实体,机构名实体,地名实体。命......
神经网络的发展及其在自然语言信息处理任务中的优异表现给多语种信息处理,尤其是维-哈-柯语言的信息处理带来了新的机遇。神经网......
在基于实例的维吾尔语汉语机器翻译系统中维吾尔语相似度计算起重要作用。维吾尔语的黏着性特性要求对单词进行词干提取。本文......
本文中比较详细地描述了维吾尔语数词词干提取所存在的问题,并对其进行了分析。提出了基于有限状态自动机和词典查询相结合的维吾尔......
本文提出了一个基于规则的哈萨克语词干提取的一种解决方法。该方法首先找到待切分词的所有可能的词干,然后以带变形词的词典和分......
针对哈萨克文本分类中词干提取效率低以及传统框架下特征表示维度高、数据稀疏、分类准确率不高等问题,提出基于哈萨克语形态分析......
开发一个多语言统一用户界面的集成信息处理软件环境,对少数民族自然语言处理研究工作特别是派生类语言的文本及语音等信息处理带......
首先介绍柯尔克孜语形态特征对词干提取的作用,之后探讨柯尔克孜语词类划分、词类的形态特征.介绍基于规则、词典以及词典和规则相......
词干提取是形态丰富语言信息处理中的基础任务,对其他自然语言处理任务有着重要的影响.该文将词干提取任务看作序列标注问题,以字......
文章对维吾尔语名词形态变化进行分析,并设计一种基于名词词干的词缀附加引擎算法.该算法可以根据词干结构自动附加1~5层词缀,并生......
根据哈萨克语语法规则设计实现哈萨克语文本的词干提取,完成哈萨克语文本的预处理.提出基于最近支持向量机的样本距离公式,结合SVM......
黏着语的自然语言处理中,词干提取作为一项基础的预处理任务,对其他任务的性能影响较大.现有的乌兹别克语词干提取任务仍依赖基于......
维吾尔语是形态变化复杂的黏着性语言,维吾尔语词干词缀切分对维吾尔语信息处理具有非常重要的意义,但到目前为止,维吾尔语词干提......
摘要:哈萨克语是组成结构复杂的黏着性语言,哈萨克语词干提取词缀提取对哈萨克语信息处理领域具有很重要的意义。从哈萨克语粘着性特......
针对维吾尔语事件类时间短语没有明显时间词特征词而引起的识别困难和边界定位不准确等问题,提出了一种统计结合词干提取的针对黏......
摘要:维吾尔语单词的构形词缀按照一定的规则连接到词干。维吾尔语的黏着语特点和构形词缀连接规则使得可以构造维吾尔语构形词缀的......
维吾尔语单词连接构形词缀时,经常发生元音弱化成央音的现象。但对已有形态变化的单词进行形态还原时,使用规则识别弱化央音的原音......
从自然语言处理以及深度学习的基本理念、原则出发,为基于中国手语的维吾尔文本信息处理研究提供数据资源,为面向手语信息的手语合......
本文提出了一个基于规则的哈萨克语词干提取的一种解决方法.该方法首先找到待切分词的所有可能的词干,然后以带变形词的词典和分类......
句子相似度计算是基于实例机器翻译的主要方法.对基于实例的哈萨克语机器翻译,哈萨克语句子相似度衡量的准确性直接影响到最终翻译......
维吾尔语单词的构形词缀按照一定的规则连接到词干.维吾尔语的黏着语特点和构形词缀连接规则使得可以构造维吾尔语构形词缀的有限......
以大规模网络维吾尔文文本的自动分类技术研究为背景,设计模块化结构的维吾尔文本分类系统,在深入调研基础上选择Naive Bayes算法......
期刊
针对维吾尔语事件类时间短语没有明显时间词特征词而引起的识别困难和边界定位不准确等问题,提出了一种统计结合词干提取的针对黏......
[目的/意义]旨在为俄语词形规范化方法研究和应用提供参考。[方法/过程]运用文献研究法和比较研究法对已有俄语词形规范化方法进行......
该文主要阐述维吾尔语词干提取中使用的名词构形词缀分析DFA的构造过程。维吾尔语属于黏着语,所以维吾尔语自然语言处理系统必须实......
哈萨克语词干提取是哈萨克语信息处理的重要的基础环节,文章采用基于规则、字典查找和最大匹配相结合的哈萨克语词干提取方法,首次......
我们为蒙古语词法分析建立了一种生成式的概率统计模型。该模型将蒙古语语句的词法分析结果描述为有向图结构,图中节点表示分析结......
蒙古语形态分析中,我们之前的有向图模型取得了较高的性能。这种建模方式以图状结构刻画句中词干和词缀之间的概率关系,从而借助上......
维吾尔语是形态变化复杂的黏着性语言,维吾尔语词干词缀切分对维吾尔语信息处理具有非常重要的意义,但到目前为止,维吾尔语词干提......
词干提取是维吾尔语自然语言处理中的基础性研究,其提取质量直接影响其他任务的性能。但目前维吾尔语词干提取研究存在过度切分、......
哈萨克语是组成结构复杂的黏着性语言,哈萨克语词干提取词缀提取对哈萨克语信息处理领域具有很重要的意义。从哈萨克语粘着性特点......
维吾尔语单词连接构形词缀时,经常发生元音弱化成央音的现象。但对已有形态变化的单词进行形态还原时,使用规则识别弱化央音的原音......
通过对维吾尔语名词形态结构进行研究,构造了名词有限状态自动机(FSM);针对自动机的缺陷使用最大熵模型给有限状态自动机加入了歧义词......
针对现有维吾尔语形态分析研究中存在的数据稀疏、模型构建复杂等问题,提出一种基于机器翻译的维吾尔语形态分析模型,即将维吾尔语词......
句子相似度计算是基于实例机器翻译的主要方法.对基于实例的哈萨克语机器翻译,哈萨克语句子相似度衡量的准确性直接影响到最终翻译结......
在自然语言处理中词性标注和词干提取是最重要的任务.文中研究与实现基于Android的维吾尔文词性标注和词干提取APP,为维吾尔语自然......
从自然语言处理以及深度学习的基本理念、原则出发,为基于中国手语的维吾尔文本信息处理研究提供数据资源,为面向手语信息的手语合......
针对维文黏着语的特点和广义后缀树提取概念间分类关系时后缀树中出现非概念词的问题,提出一种改进的基于广义后缀树的维文领域本......