论文部分内容阅读
从2001年中国加入世贸组织之后,我国和世界的融合越来越紧密,数以亿计的中国人开始英语。阅读是英语学习的五种学习手段之一。当今英语教材和阅读读物随处可见,同时互联网也给英语学习者提供了大量的英语原版材料,这对学习者是一个好消息。可问题是并不是所有的读物都适合读者阅读。阅读材料太简单,学习的效率就会很低,而如果太难,则会让读者对阅读望而却步。面对大量的阅读读物,学习者对于该学什么样的材料感到迷惑。教育工作者应该承担起为学习者挑选适合他们阅读的责任。可读性是指读者对文本难易程度的主观判断。现在有关可读性的应用仅限于提供文本的难度,或是向读者提供适合他们阅读的材料,但是在这之前需要使用其他工具测试读者的阅读能力。另外,读者的阅读能力是不断提高的,这就意味着读者需要不断地测试自己的阅读能力。这些不足都对读者使用这些软件带来了一定的不便。因此,本文试图将阅读能力和可读性测试整合起来,并且动态测试文本的可读性或者依据读者的阅读能力向其提供从互联网获取的适合他自己阅读的材料。在影响文本可读性的因素中,词汇被公认是最能反映可读性的因素。词汇覆盖率是指一篇文本里读者熟悉的词汇数量占该文本词汇总数的比例。它反映了文本和读者的交互,同时随着读者词汇的变化,它能更好地动态测试文本的可读性。本文依据词汇覆盖率理论,开发了基于覆盖率的阅读材料辅助挑选系统。该系统使用清单方法来找到读者认识的单词,形成读者词表,然后计算和呈现读者词表对测试文本的词汇覆盖率,最后依据读者词表,向读者提供由WebCorp检索得到的,符合他阅读的材料。