搜索筛选:
搜索耗时1.0479秒,为你在为你在102,285,761篇论文里面共找到 62 篇相符的论文内容
类      型:
[期刊论文] 作者:荀恩东, 来源:高技术通讯:英文版 年份:1999
[学位论文] 作者:荀恩东, 来源:哈尔滨工业大学 年份:1999
句法分析是自然语言处理的一个重要研究内容之一,给定输入句子,句法分析的任务就是生成一棵带有句法功能标记的短语结构树,它能指明短语的构成成分及其之间的相互关系.英语句...
[期刊论文] 作者:于东, 荀恩东,, 来源:中文信息学报 年份:2014
该文提出基于Word Embedding的歧义词多个义项语义表示方法,实现基于知识库的无监督字母缩略术语消歧.方法分两步聚类,首先采用显著相似聚类获得高置信度类簇,构造带有语义标...
[期刊论文] 作者:臧娇娇, 荀恩东,, 来源:中文信息学报 年份:2017
该文从中文信息处理角度对动宾型离合词自动识别进行研究。通过分析离合词在实际语料中的使用特点以及离合词离析成分在大规模语料库中的表现形式,从离合词内部入手,形式化地...
[期刊论文] 作者:荀恩东,颜伟, 来源:情报学报 年份:2006
本文介绍一种基于WordNet的计算英语词语相似度的实现方法:从WordNet中提取同义词并采取向量空间方法计算英语词语的相似度。向量包括三方面:(1)WordNet的同义词词集(Synset),(2)类属......
[期刊论文] 作者:荀恩东,赵铁军, 来源:情报学报 年份:1999
本文给出了BT863-Ⅱ英汉机器翻译中,规则和统计方法并举的译文选择策略。基于规则的译文选择方法主要通过考察英语单词在一定上下文中的句法和语义特征,形成支持译文选择的规则;基于统......
[期刊论文] 作者:荀恩东,李生, 来源:计算机研究与发展 年份:2000
提出了语料库和机器学习相结合的方法识别英语句子中的简单的、非递归的名词短语(BaseNP),在含有词性标注和BaseNP边界标注的训练语料中,抽取所有不同类型BaseNP短语对应的词性序列(BaseNP规则),通过规则排序......
[期刊论文] 作者:荀恩东,李晟,, 来源:计算机研究与发展 年份:2009
新术语及其定义抽取是信息抽取的重要研究内容之一.研究结果表明,在科技文献中,一个新术语往往伴随其定义出现,通过考察,在真实文本中,术语定义存在显著的语言表述特征,从大规模真实语料库中,通过考察术语定义构成的语言学模式、定义中词汇和术语周边的统计特征......
[期刊论文] 作者:荀恩东,李生, 来源:高技术通讯 年份:1998
采用《汉语义词词林》和英汉双语语料库,通过“双语对齐”扩充了英汉词典的单记号译文;对大规模汉语语料库以B+树算法为骨架统计了双语词组二元同现频次。...
[期刊论文] 作者:荀恩东,蔡萌, 来源:计算机科学 年份:1998
引言文语转换系统具有将输人的文字自动地转换成语音的功能,广泛地应用于文稿校对、语音应答系统、电子邮件的语音服务等领域。根据合成模型的不同,可以将文语转换技术划...
[会议论文] 作者:于东;荀恩东;, 来源:第三届CCF大数据学术会议 年份:2015
  研究从非结构化文本中抽取指定人物职衔履历信息的方法.针对履历信息中知识密集的特点,定义职衔履历知识结构,提出从字符串模式和依存上下文两个角度刻画履历信息.采用弱监......
[会议论文] 作者:颜伟,荀恩东, 来源:第二届全国学生计算语言学研讨会 年份:2004
本文主要介绍一种基于WordNet的英语词语相似度的实现方法,我们从WordNet中提取同义词并采取向量空间方法计算英语词语的相似度,我们的向量包括三方面:(1)WordNet的同义词词...
[期刊论文] 作者:钱揖丽,荀恩东,, 来源:计算机工程与应用 年份:2008
提出了一种基于分类回归树(Classification And Regression Tree,CART)的汉语韵律短语识别方法。该方法从语音流中提取与韵律短语边界有关的声学特征,从文本中提取短语边界的语言学特征,并将两类特征有机结合构成CART特征集,建立CART决策模型。开放测试结果显示......
[期刊论文] 作者:钱揖丽,荀恩东,, 来源:计算机工程与应用 年份:2008
正确标记短语间的停顿,对提高文语转换系统合成语音的自然度起着重要作用。介绍一种采用最大熵模型从真实自然的语音流中自动识别汉语短语间停顿的方法。模型的特征集包含语...
[期刊论文] 作者:钱揖丽,荀恩东,, 来源:模式识别与人工智能 年份:2008
语音停顿被认为是有声语言的标点符号.在语言交流中,说话人会在韵律短语的边界处插入长短不同的停顿.利用这一性质,在调查标点符号停顿作用的基础上,提出基于标点信息预测语...
[会议论文] 作者:牟小峰,荀恩东, 来源:中国中文信息学会 年份:2010
短语预调序是提高机器翻译效果的有效手段。本文通过对英汉翻译中名词短语结构的分析,总结得到名词短语调序规则,通过将这些规则进行短语预调序,提高了最终的翻译效果。为了缓解专家规则覆盖范围太大的弊端,本文从大规模双语语料中自动获取实例规则。通过使用专家规......
[期刊论文] 作者:荀恩东,李生,赵铁军, 来源:高技术通讯 年份:1998
采用《汉语同义词词林》和英汉双语语料库,通过“双语对齐”扩充了英汉词典的单词译文;对大规模汉语语料库以B+树算法为骨架统计了汉语词组二元同现频次。在英汉机器翻译中,针对翻......
[期刊论文] 作者:荀恩东,赵铁军,李生, 来源:情报学报 年份:1999
本文给出了BT863-Ⅱ英汉机器翻译中,规则和统计方法并举的译文选择策略.基于规则的译文选择方法主要通过考察英语单词在一定上下文中的句法和语义特征,形成支持译文选择的规...
[期刊论文] 作者:荀恩东,李生,赵铁军,, 来源:计算机研究与发展 年份:2000
提出了语料库和机器学习相结合的方法识别英语句子中的简单的、非递归的名词短语(BaseNP).在含有词性标注和BaseNP边界标注的训练语料中,抽取所有不同类型BaseNP短语对应的词...
[会议论文] 作者:王洁,荀恩东,宋柔, 来源:第二届全国学生计算语言学研讨会 年份:2004
词性标注的关键是兼类词的排歧.本文探讨了一种方法来解决兼类问题,并以动词中的兼类词为切入点做了实验,即利用非兼类动词(纯动词)在大规模语料中的分布信息来判断具体上下文中出现的某个与动词有关的兼类词的词性.这种方法不需要人工标注好词性的训练语料,所......
相关搜索: