基于模糊C-均值聚类分析英语情态动词can的语义重叠

来源 :燕山大学 | 被引量 : 0次 | 上传用户：lily009009

【摘要】

：

语义重合是日常生活中常见的一种现象,尤其在我们的语言中。这种现象给日常交际带来了很大困扰，已经成为自然语言研究中的一个难题。为了解决这个难题，我们首先应该确定词的语

【作者】

：

王伟丽

【出处】

：

燕山大学

【发表日期】

：

2012年期

【关键词】

：

情态动词can 模糊c均值聚类语义确定特征选择

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语义重合是日常生活中常见的一种现象,尤其在我们的语言中。这种现象给日常交际带来了很大困扰，已经成为自然语言研究中的一个难题。为了解决这个难题，我们首先应该确定词的语义。语义确定是信息检索、机器翻译、文本分类、语音识别以及人机交互诸多领域中的关键环节，已经在信息理论、人工智能和一些其他的自然科学和技术领域中取得了令人瞩目的进步。尽管语义确定已取得了很大发展，但目前语义确定的对象主要集中在普通动词、名词和形容词上，在英语情态动词方面的研究很少。情态表达说话人的意见和态度，主要由情态动词来实现。因此，正确识别情态动词的语义对理解和领会说话人的意见和态度十分重要。本文通过对一百万字语料库的标注、统计和分析，首先提取了can的六个语言特征，包括两个语义特征和四个句法特征，其中一个句法特征和两个语义特征共同作为实验的三组数据，最后采用模糊c均值聚类的方法，从而构建出能在语义重叠的情况下确定情态动词can语义的模型。实验结果表明,该模型达到了95%的正确率。实验结果同时也给出了情态动词can的两个意义的分布状况。研究发现，当在肯定句中，或当主语有生命时，或主语有内在能力做某事时，can倾向于“能够”的语义。当在否定句中，或当动词为表状态的动词时，或当动词为行为动词，而且动作可能将来发生时，或当主语无生命时，can具有“可能”的语义。在此基础上，本文又把两个语义特征分别和其余三个句法特征结合起来建立了三个新的模型，并将这三个新模型的聚类结果与先前建立的模型聚类结果进行了对比，结果表明，语义信息特征对确定情态动词语义的影响大于句法信息特征的对其的影响。其中，情态动词can与其后的动词的互信息特征、情态动词can与主语的互信息特征和否定特征是影响情态动词can语义的最重要的三个特征。成功聚类模型，不仅有助于在语义重叠的情况下确定情态动词can的语义，而且还有助于实现语料库的自动语义标注，减轻研究人员的负担，更有助于提高机器翻译的质量。本文研究结果为情态动词语义学研究和语义排歧研究提供了有利的依据，也为情态动词自然语言处理中的特征选择提供了有利的依据。

其他文献

月经病与乳腺疾病异病同治机制探究

月经病和乳腺疾病是危害广大妇女的两大疾病。中医妇科起源较早，发展较快，至今已发展成为一门具有成熟理论体系和丰富临床经验的学科。中医对于乳腺病的认识早在《内经》已有记

期刊

月经痛乳腺疾病

申请法律援助须知

一、什么是法律援助法律援助是指在国家设立的法律援助机构的指导和协调下,律师、公证员员、基层法律工作者等法律服务人员为经济困难或特殊案件的当事人给予减、免收费,提供

期刊

诉讼法律法律援助机构公证员非诉讼法律服务基层法律工作者特殊案件律师

益气升阳法治疗老年泛发性湿疹疗效观察

目的:观察益气升阳法治疗老年泛发性湿疹的临床疗效。方法:70例老年泛发性湿疹患者按照随机数表法分为治疗组和对照组各35例,对照组给予硫代硫酸钠注射液静脉滴注及盐酸非索

期刊

泛发性湿疹老年益气升阳猪肤临床观察

中央政治局是如何设立的?

1921年,党的一大召开时,鉴于党内党员少等特点,中央只设由3人组成的中央局。党的二大、三大、四大,虽然选举了中央执行委员会,但中央机构仍是中央局。1927年4月27日,中国共产

期刊

中央执行委员会全国代表大会党员人数中央局中共四大中国共产党

和合翻译理论指导下的劳动合同英译

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

学位

翻译实践劳动合同差异及相似点和合翻译理论翻译方法

当代英语V-ed形式的词位地位

在传统语法中,V-ed形式一直被定义为动词的一种屈折变化形式，是动词时态和语态的体现之一,本身不具有词位地位，但因其复杂的语法功能一直受到语言学家的关注。但大部分语言学家

学位

V-ed形式使用频率词位地位词汇化义数项

流域土壤侵蚀及径流过程自动测量系统研究

流域内降雨-径流-土壤侵蚀过程中不同时空点处流量、流速、泥沙含量的获取将为侵蚀模拟-预报模型的建立与检验提供必要的数据支持。本研究提出一套测量流域土壤侵蚀动态变化

期刊

流域土壤侵蚀模型试验流量流速泥沙含量测量系统

基于模糊C-均值聚类分析英语情态动词can的语义重叠

其他学术论文