搜索筛选:
搜索耗时0.7291秒,为你在为你在102,285,761篇论文里面共找到 26 篇相符的论文内容
类      型:
[学位论文] 作者:诺明花, 来源:中国科学院大学 年份:2012
随着计算机和互联网的发展,在自然语言处理领域,以双语(或多语)平行语料库为基础的应用日益增多。除机器翻译方面的应用之外,平行语料库的建设对于双语词典编纂、词义消岐和跨语言......
[学位论文] 作者:诺明花, 来源:新疆大学 年份:2018
[期刊论文] 作者:唐朝,诺明花,胡岩, 来源:中文信息学报 年份:2020
关系抽取主要目的是将非结构化或半结构化描述的自然语言文本转化成结构化数据,其主要负责从文本中识别出实体,抽取实体间的语义关系。就关系抽取任务而言,当前流行的网络结...
[会议论文] 作者:诺明花,吾守尔, 来源:第十一届全国民族语言文字信息学术研讨会 年份:2007
本文小词汇量特定人维吾尔语孤立词语音识别是基于DTW识别方法,提取梅尔倒频谱特征参数,码本设计时使用LBG算法。每个单词对应的.vq文件,它充当参考模板库。在孤立数字识别的基础上,分析十个维语数字音子特性建立音子模型,Matlab6.2仿真基于聚类的方法训练参考......
[会议论文] 作者:诺明花[1]吾守尔[2], 来源:第十一届全国民族语言文字信息学术研讨会 年份:2007
本文小词汇量特定人维吾尔语孤立词语音识别是基于DTW识别方法,提取梅尔倒频谱特征参数,码本设计时使用LBG算法。每个单词对应的.vq文件,它充当参考模板库。在孤立数字识别的...
[会议论文] 作者:诺明花;吴健;李文波;, 来源:2007年全国高性能计算学术年会 年份:2007
本文为了实现高性能藏文网页网站信息过滤系统,从两个不同层次考虑并行。首先,将应用Glushkov位并行算法实现藏文关键词精确匹配功能,从而在海量网络实时信息中快速过滤藏文...
[期刊论文] 作者:诺明花,吾守尔·斯拉木,, 来源:计算机工程与应用 年份:2006
文章提出了一种新的语音信息检测的较灵活的方法。其中用到了两种技术:人工神经网络和复倒谱矩阵。目的是如果用人工神经网络就能够较彻底地解决未明确定义的映射关系。对各...
[期刊论文] 作者:龙从军, 刘汇丹, 诺明花, 吴健,, 来源:中文信息学报 年份:2015
该文选取了藏语文中小学教材的部分语料,构建了带有藏语字性标记、词边界标记和词性标记的语料库,通过比较不同的分词、标注方法,证明分词、词性标注一体化效果比分步进行的...
[期刊论文] 作者:李文波,孙乐,诺明花,吴健,, 来源:通信学报 年份:2008
在深入分析敏感信息过滤任务的特点和难点的基础上,针对现有一般的信息过滤方法的不足,提出了一种利用敏感词的组合信息来改进过滤效果的思想。进而,研究了在核方法的框架下特征共现行为建模的原则并提出了复合ANOVA核来刻画特征组合行为。通过真实信息过滤环境......
[期刊论文] 作者:诺明花,吾守尔·斯拉木, 来源:计算机工程与应用 年份:2006
文章提出了一种新的语音信息检测的较灵活的方法。其中用到了两种技术:人工神经网络和复倒谱矩阵。目的是如果用人工神经网络就能够较彻底地解决未明确定义的映射关系。对各种......
[期刊论文] 作者:诺明花, 吴健, 刘汇丹, 丁治明,, 来源:中文信息学报 年份:2011
该文从法律法规和公文领域汉藏语料中对待翻译汉语短语提取藏语译文。目前普遍采用的短语对抽取方法需要依赖于词性或句法分析等资源或词对齐技术。考虑现阶段藏文资源不足,...
[期刊论文] 作者:刘汇丹, 洪锦玲, 诺明花, 吴健,, 来源:中文信息学报 年份:2017
针对从互联网获取的一份包含19万藏文网页,总计427万句、9 328万音节字的藏文文本语料,该文按照预定的规则对其中的藏文音节拼写错误情况进行了统计与分析。数据显示,在语料...
[期刊论文] 作者:诺明花,刘汇丹,吴健,丁治明, 来源:中文信息学报 年份:2012
针对为汉藏辅助翻译系统建立汉藏多词单元翻译词典这一任务,该文提出了CMWEPM模型。该模型首先依据关联度和结合度来确定汉语语料中多词单元的边界,然后根据词对齐信息分别抽...
[期刊论文] 作者:安波,诺明花,吴健,刘汇丹,马龙龙, 来源:信息技术与标准化 年份:2015
设计并实现了一种基于语料库的传统蒙古文同形不同码识别系统。通过网络爬虫获取原始语料,然后对语料进行预处理并生成词表和倒排索引。基于词表利用GDI和传统蒙古文字库对每...
[期刊论文] 作者:刘汇丹, 诺明花, 马龙龙, 吴健, 贺也平,, 来源:中文信息学报 年份:2015
该文结合链楼分析技术和藏文编码识别技术,使用网络爬虫实现对互联网上藏文文本资源的挖掘,分析了Web藏文文本资源的分布情况.统计数据显示,国内藏文网站50%以上在青海省;约87...
[期刊论文] 作者:刘汇丹, 诺明花, 赵维纳, 吴健, 贺也平,, 来源:中文信息学报 年份:2012
在分析现有藏文分词方法的基础上,该文重点研究了藏文分词中的格助词分块、临界词识别、词频统计、交集型歧义检测和消歧等问题并提出了相应的方法。应用这些方法,设计实现了...
[期刊论文] 作者:诺明花, 刘汇丹, 马龙龙, 吴健, 丁治明,, 来源:中文信息学报 年份:2013
该文提出汉藏基本名词短语对齐框架。从汉语基本名词短语出发,找藏文正确译文过程中,参考英汉短语对齐的方法,针对藏语的特殊性,提出基于中心语块扩展的藏语基本名词短语识别...
[期刊论文] 作者:诺明花, 张立强, 刘汇丹, 吴健, 丁治明,, 来源:中文信息学报 年份:2011
该文将从汉藏法律法规和公文领域平行语料中提取双语短语对。考虑现阶段藏文资源匮乏,提出两步汉藏短语抽取方法。第一步是提取汉语有效语块,这部分工作不是该文工作重点。第...
[会议论文] 作者:诺明花,刘汇丹,马龙龙,吴健,丁治明, 来源:中国中文信息学会,上海交通大学 年份:2012
本文提出汉藏基本名词短语对齐框架。从汉语基本名词短语出发,找藏文正确译文过程中,参考英汉短语对齐的方法,针对藏文语言的特殊性,提出基于中心语块扩展的藏文基本名词短语识别方法。提出词典与自动词对齐结果相结合的方法和基于序列相交的方法抽取藏文中心语块;再......
[会议论文] 作者:刘汇丹,诺明花,赵维纳,吴健,贺也平, 来源:中国中文信息学会 年份:2010
由于藏文编码国家标准和国际标准发布较晚,并且基于国际标准小字符集编码实现藏文支持的技术相对复杂,藏文应用软件一般使用自定义的藏文编码实现对藏文的支持.由于藏文编码繁多,为了实现对有限的藏文电子资源的充分利用,开发一套藏文编码转换软件是十分必要的.......
相关搜索: