搜索与诺明花相关的论文

面向汉藏辅助翻译的短语对齐方法研究

[学位论文] 作者：诺明花, 来源：中国科学院大学年份：2012

随着计算机和互联网的发展，在自然语言处理领域，以双语（或多语）平行语料库为基础的应用日益增多。除机器翻译方面的应用之外，平行语料库的建设对于双语词典编纂、词义消岐和跨语言......

下载此文

维吾尔语孤立词和连续数字语音识别系统的设计与实现

[学位论文] 作者：诺明花, 来源：新疆大学年份：2018

...

下载此文

ResNet结合BiGRU的关系抽取混合模型

[期刊论文] 作者：唐朝,诺明花,胡岩, 来源：中文信息学报年份：2020

关系抽取主要目的是将非结构化或半结构化描述的自然语言文本转化成结构化数据,其主要负责从文本中识别出实体,抽取实体间的语义关系。就关系抽取任务而言,当前流行的网络结...

下载此文

维吾尔语孤立词和连续数字语音识别设计与实现

[会议论文] 作者：诺明花,吾守尔, 来源：第十一届全国民族语言文字信息学术研讨会年份：2007

本文小词汇量特定人维吾尔语孤立词语音识别是基于DTW识别方法,提取梅尔倒频谱特征参数,码本设计时使用LBG算法。每个单词对应的.vq文件,它充当参考模板库。在孤立数字识别的基础上,分析十个维语数字音子特性建立音子模型,Matlab6.2仿真基于聚类的方法训练参考......

下载此文

维吾尔语孤立词和连续数字语音识别设计与实现

[会议论文] 作者：诺明花[1]吾守尔[2], 来源：第十一届全国民族语言文字信息学术研讨会年份：2007

本文小词汇量特定人维吾尔语孤立词语音识别是基于DTW识别方法,提取梅尔倒频谱特征参数,码本设计时使用LBG算法。每个单词对应的.vq文件,它充当参考模板库。在孤立数字识别的...

下载此文

藏文信息过滤系统并行模式的设计与实现

[会议论文] 作者：诺明花;吴健;李文波;, 来源：2007年全国高性能计算学术年会年份：2007

本文为了实现高性能藏文网页网站信息过滤系统,从两个不同层次考虑并行。首先,将应用Glushkov位并行算法实现藏文关键词精确匹配功能,从而在海量网络实时信息中快速过滤藏文...

下载此文

一种语音信息检测方法的研究

[期刊论文] 作者：诺明花,吾守尔·斯拉木,, 来源：计算机工程与应用年份：2006

文章提出了一种新的语音信息检测的较灵活的方法。其中用到了两种技术:人工神经网络和复倒谱矩阵。目的是如果用人工神经网络就能够较彻底地解决未明确定义的映射关系。对各...

下载此文

基于藏语字性标注的词性预测研究

[期刊论文] 作者：龙从军, 刘汇丹, 诺明花, 吴健,, 来源：中文信息学报年份：2015

该文选取了藏语文中小学教材的部分语料,构建了带有藏语字性标记、词边界标记和词性标记的语料库,通过比较不同的分词、标注方法,证明分词、词性标注一体化效果比分步进行的...

下载此文

基于核方法的敏感信息过滤的研究

[期刊论文] 作者：李文波,孙乐,诺明花,吴健,, 来源：通信学报年份：2008

在深入分析敏感信息过滤任务的特点和难点的基础上,针对现有一般的信息过滤方法的不足,提出了一种利用敏感词的组合信息来改进过滤效果的思想。进而,研究了在核方法的框架下特征共现行为建模的原则并提出了复合ANOVA核来刻画特征组合行为。通过真实信息过滤环境......

下载此文

一种语音信息检测方法的研究

[期刊论文] 作者：诺明花,吾守尔·斯拉木, 来源：计算机工程与应用年份：2006

文章提出了一种新的语音信息检测的较灵活的方法。其中用到了两种技术：人工神经网络和复倒谱矩阵。目的是如果用人工神经网络就能够较彻底地解决未明确定义的映射关系。对各种......

下载此文

汉藏短语对抽取中短语译文获取方法研究

[期刊论文] 作者：诺明花, 吴健, 刘汇丹, 丁治明,, 来源：中文信息学报年份：2011

该文从法律法规和公文领域汉藏语料中对待翻译汉语短语提取藏语译文。目前普遍采用的短语对抽取方法需要依赖于词性或句法分析等资源或词对齐技术。考虑现阶段藏文资源不足,...

下载此文

基于大规模网络语料的藏文音节拼写错误统计与分析

[期刊论文] 作者：刘汇丹, 洪锦玲, 诺明花, 吴健,, 来源：中文信息学报年份：2017

针对从互联网获取的一份包含19万藏文网页,总计427万句、9 328万音节字的藏文文本语料,该文按照预定的规则对其中的藏文音节拼写错误情况进行了统计与分析。数据显示,在语料...

下载此文

基于关联度的汉藏多词单元等价对抽取方法

[期刊论文] 作者：诺明花,刘汇丹,吴健,丁治明, 来源：中文信息学报年份：2012

针对为汉藏辅助翻译系统建立汉藏多词单元翻译词典这一任务,该文提出了CMWEPM模型。该模型首先依据关联度和结合度来确定汉语语料中多词单元的边界,然后根据词对齐信息分别抽...

下载此文

传统蒙古文“同形不同码”问题研究

[期刊论文] 作者：安波,诺明花,吴健,刘汇丹,马龙龙, 来源：信息技术与标准化年份：2015

设计并实现了一种基于语料库的传统蒙古文同形不同码识别系统。通过网络爬虫获取原始语料,然后对语料进行预处理并生成词表和倒排索引。基于词表利用GDI和传统蒙古文字库对每...

下载此文

Web藏文文本资源挖掘与利用研究

[期刊论文] 作者：刘汇丹, 诺明花, 马龙龙, 吴健, 贺也平,, 来源：中文信息学报年份：2015

该文结合链楼分析技术和藏文编码识别技术,使用网络爬虫实现对互联网上藏文文本资源的挖掘,分析了Web藏文文本资源的分布情况.统计数据显示,国内藏文网站50％以上在青海省;约87...

下载此文

SegT:一个实用的藏文分词系统

[期刊论文] 作者：刘汇丹, 诺明花, 赵维纳, 吴健, 贺也平,, 来源：中文信息学报年份：2012

在分析现有藏文分词方法的基础上,该文重点研究了藏文分词中的格助词分块、临界词识别、词频统计、交集型歧义检测和消歧等问题并提出了相应的方法。应用这些方法,设计实现了...

下载此文

基于中心语块扩展的汉藏基本名词短语对的识别

[期刊论文] 作者：诺明花, 刘汇丹, 马龙龙, 吴健, 丁治明,, 来源：中文信息学报年份：2013

该文提出汉藏基本名词短语对齐框架。从汉语基本名词短语出发,找藏文正确译文过程中,参考英汉短语对齐的方法,针对藏语的特殊性,提出基于中心语块扩展的藏语基本名词短语识别...

下载此文

汉藏短语抽取

[期刊论文] 作者：诺明花, 张立强, 刘汇丹, 吴健, 丁治明,, 来源：中文信息学报年份：2011

该文将从汉藏法律法规和公文领域平行语料中提取双语短语对。考虑现阶段藏文资源匮乏,提出两步汉藏短语抽取方法。第一步是提取汉语有效语块,这部分工作不是该文工作重点。第...

下载此文

基于中心语块扩展的汉藏基本名词短语对识别

[会议论文] 作者：诺明花,刘汇丹,马龙龙,吴健,丁治明, 来源：中国中文信息学会,上海交通大学年份：2012

本文提出汉藏基本名词短语对齐框架。从汉语基本名词短语出发，找藏文正确译文过程中，参考英汉短语对齐的方法，针对藏文语言的特殊性，提出基于中心语块扩展的藏文基本名词短语识别方法。提出词典与自动词对齐结果相结合的方法和基于序列相交的方法抽取藏文中心语块；再......

下载此文

藏文编码转换软件“藏码通”的设计与实现

[会议论文] 作者：刘汇丹,诺明花,赵维纳,吴健,贺也平, 来源：中国中文信息学会年份：2010

由于藏文编码国家标准和国际标准发布较晚,并且基于国际标准小字符集编码实现藏文支持的技术相对复杂,藏文应用软件一般使用自定义的藏文编码实现对藏文的支持.由于藏文编码繁多,为了实现对有限的藏文电子资源的充分利用,开发一套藏文编码转换软件是十分必要的.......

下载此文

看过本文同时还关注