搜索筛选:
搜索耗时1.5294秒,为你在为你在102,285,761篇论文里面共找到 10 篇相符的论文内容
类      型:
[期刊论文] 作者:王花,古丽拉·阿东别克,, 来源:计算机工程 年份:2010
哈萨克语作为新疆少数民族语言之一,其词频统计作为自然语言处理的基础性课题,成为需要迫切解决的问题.基于此,介绍Zapf定律及哈萨克语词频统计之间的联系.对连续输入哈萨克...
[会议论文] 作者:王花;古丽拉·阿东别克;, 来源:第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会 年份:2010
词频统计在信息处理中发挥重要作用。哈萨克语作为新疆少数民族语言之一,词频统计作为自然语言处理的基础性课题成为需要迫切解决的问题,介绍了Zipf定律及哈萨克语词频统计之...
[期刊论文] 作者:孙瑞娜,古丽拉·阿东别克,, 来源:中文信息学报 年份:2010
以哈萨克语基本名词短语识别为目标,实现了哈萨克语基本名词短语自动识别系统。采用基于规则自动识别及人工标注的方法建立基本名词短语标注语料库,在此基础上,采用统计和规则相结合的识别方法,利用互信息进行基本名词短语边界预测,然后根据哈萨克语基本名词短......
[期刊论文] 作者:孙瑞娜,古丽拉·阿东别克,, 来源:计算机应用研究 年份:2010
以哈萨克语基本名词短语识别为目标,采用基于规则的方法,从基本名词短语结构语法模型出发,利用哈萨克语基本名词短语的词性标记信息及构形附加成分信息,建立了基本名词短语规则集,设计了哈萨克语基本名词短语自动识别系统,实现了对30万词级哈萨克语语料库的基本......
[期刊论文] 作者:侯呈风,古丽拉·阿东别克,, 来源:计算机工程与应用 年份:2010
哈萨克语的词性标注在自然语言信息处理领域中扮演着重要角色,是句法分析、信息抽取、机器翻译等自然语言处理的基础.在传统的HMM的基础上改进了HMM模型参数的计算、数据平滑...
[会议论文] 作者:王晓莉,古丽拉·阿东别克, 来源:第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会 年份:2010
提出一种机器识别哈萨克语句情感的模型。首先使用条件随机场(CRFs)对哈萨克语句中的情感关键词进行识别,在此基础上结合语句逻辑结构分析,能初步判断出哈萨克语句的喜、怒、哀......
[期刊论文] 作者:王花,古丽拉·阿东别克,吴守用,, 来源:计算机应用 年份:2010
介绍了支持向量机(SVM)和k-最近邻法(kNN)分类算法的思想和两种哈萨克语特征提取方法。对SVM、kNN和Bayes算法在哈萨克语文本分类的实验进行了比较。实验结果表明:在处理哈萨克语文本分类问题上,SVM较kNN和Bayes有较好的分类效果。由于哈萨克文单词的语素和构形......
[会议论文] 作者:玛依来·哈帕尔,古丽拉·阿东别克, 来源:中国中文信息学会 年份:2010
本文利用K-最近距离算法对哈萨克语文本进行分类,通过统计词频信息和语言信息相结合的方法选择特征,实现了一个哈萨克语文本分类系统。在计算特征权重值时不仅考虑词频,还利用了特征的集中度、分散度,经过训练和统计对每一类哈萨克语文本形成特征的权重向量,然......
[期刊论文] 作者:冯鲸华,古丽拉·阿东别克,吴守用,王花,, 来源:计算机应用与软件 年份:2010
针对哈萨克语文本中人名构成特点,提出了一种基于位置概率模型的哈萨克语人名可信度计算方法,构建了一个哈萨克语人名识别系统。系统分为训练和识别两个模块,识别过程是:首先从训练语料中提取特征进行训练,得到一个特征训练模型,然后利用训练好的特征模型及少量......
[期刊论文] 作者:冯鲸华,古丽拉·阿东别克,玛依来·哈帕尔,, 来源:计算机工程与应用 年份:2010
针对哈萨克文文本中机构名构成特点,提出了一种基于N-gram语言模型的哈萨克文机构名可信度计算方法,并以机构名尾词为触发词,构建了一个哈萨克文机构名识别系统.系统分为训练...
相关搜索: