论文部分内容阅读
模糊性是自然语言的本质特征,在人类生活中随处可见。1965年美国自动控制专家扎德提出形式化,数学化的模糊集概念,给模糊语言的研究带来了空前的变革,模糊语言学应运而生,随后的模糊语言研究开始使用数学的方法,国外学者采用数理逻辑运算和实际语料的实验数据统计等研究方法;国内学者则进行了大量的定性研究。但把现代计算机技术与模糊语言学成果相结合模拟人脑思维机制进行模糊语义推理的研究,利用计算机技术计算模糊词语中不同语义分布的研究,以及将这两种研究方法进行比较分析的研究都甚为少见。英语情态动词是一个复杂模糊的系统并在人类的言语交际中发挥着重要的作用。本文主要是利用自适应神经网络模糊系统建立模型对情态动词will的根意义进行语义推理,其次使用模糊C均值聚类确定英语情态动词will的根意义,然后对这两种研究方法进行比较分析。首先建立并标注了120万字语料库中英语情态动词will的根意义,然后采用Wconcord软件统计情态动词will根意义分别与其后主要动词及主语的互信息,选择可能影响情态动词will语义的句法、语义及上下文语境特征,并赋予其逻辑值。在此基础上,利用Matlab的ANFIS工具箱建立了will的自适应神经网络模糊系统模型并通过一系列实验选出最优模型参数。平均检验精度达到90%。通过实验结果获得影响情态动词will根意义的特征排序,这个排序结果对情态动词will根意义的模糊语义渐变研究有重要的实用价值,可让英语学习者深入了解这些特征对语义影响的相对性。另外,采用模糊C均值聚类方法,在Matlab环境下建立了will的模糊聚类模型,直接得到情态动词will根意义的语义确定结果。语义聚类精确度达到79%。最后,把这一结果与利用自适应神经网络模糊系统建立的最优模型进行比较,得出结论,在英语情态动词will的根语义排歧上自适应神经网络模糊推理系统优于模糊C-聚类方法。