论文部分内容阅读
海军英语是在海军这个语域范围内进行与海军职业活动有关的语言交流所必需的英语,具有与其它英语不同的显著特征。本文以100万词的海军英语语料库为基础,以BNC语料库作为参照语料库,结合大学英语四级和六级词汇,借助自然语言处理和计量语言学的有关方法对海军英语词汇在词目的层面上进行研究从而得出海军英语词汇的量化特点。具体研究以下四个问题:(1)海军英语语篇的词汇分布和词汇密度。(2)大学英语四级和六级词汇对海军英语的覆盖率。(3)海军英语词汇的增长模式及累计语篇中新词汇的分布。(4)海军英语中一次频词的分布特点及增长模式。研究结果表明:(1)海军英语词汇密度小于普通英语。相同长度的海军英语样本中的词汇呈正态分布,其词汇密度值分布离散度较小。长度为2,000单词的海军英语语篇的词汇量95%的可能范围为461-841。(2)大学英语四级和六级词汇对海军英语的单篇词汇覆盖率成正态分布。大学英语四级和六级词汇覆盖海军英语语料库样本中词汇的绝大部分,分别占整个1,082,000样本形符总数的80.31%和83.05%,对海军英语阅读非常重要,但不足以达到95%的覆盖率,所以学习者在只掌握四六级词汇的情况下不能顺利阅读海军英语的文章。本文根据统计结果建立一个补充词汇表,在将其加入大学英语词汇表后,使其对海军英语的单篇词汇覆盖率提高到95%。(3)海军英语的词汇增长率小于普通英语。Brunet模型与海军英语的词汇增长曲线有很好的拟合,适合海军英语的词汇量与词汇总数关系的描述。可以用于推断任意给定的词汇量所需要的语篇数及任意数量的语篇可生成的词汇量。(4)海军英语中一次频词的存在是海军英语学习者在词汇习得和阅读理解方面出现障碍的主要因素,占样本总词汇量的45.13%,其数量变化的总体趋势是随着样本的增加而增大。相同长度的海军英语样本中一次频词呈正态分布。长度为2,000单词的海军英语语篇的一次频词的95%的可能范围为233-551。该研究结果对海军英语教学有显著意义;同时还为海军英语词表制定、考试命题及教材编写提供可靠的量化依据。