论文部分内容阅读
摘要:本论文将使用语料库检索软件,对美国作家弗兰克·鲍姆(Frank Baum)创作的儿童文学作品《绿野仙踪》的文本特征、主要内容等方面进行分析,以展示语料库检索软件在文学分析方面的强大功能,提高英语专业大学生对英语文学学习的兴趣,促进他们的英语学习。
关键词:语料库;《绿野仙踪》;文本分析
1简介
随着近年来信息技术的发展以及计算机的普及和语料库研究的渐渐升温,国内外不少学者将语料库研究方法应用到文学领域,利用语料库检索软件(Concordance)对文学语篇进行分析,如Conrad、杨建枚、张厚振等。他们的研究大胆创新,十分具有操作性,为后来的文学研究者带来很大的启示。并且语料库研究方法也为英语专业的学习带来了非常大的便利,也节省了资源与时间,是一种高效的研究方法。
《绿野仙踪》又名《奇妙的奥兹男巫》,是美国作家弗兰克·鲍姆创作发表的奇幻冒险童话故事集,共十四本。问世百年以来被翻译成多种语言出版,根据《绿野仙踪》故事改编的动画片和电影更是不计其数。国内常见的《绿野仙踪》是这个系列的第一本。《绿野仙踪》主要讲述了小女孩“Dorothy”和她的小狗“Toto”被龙卷风吹到了一个奇妙的“Oz”(奥兹国),小女孩为了能回到自己的家,经历了一系列有趣又惊现的事情,最后安全回家的故事。
2基于词表的语篇基本情况分析
基于语料库的语言研究一般采取定性与定量相结合的研究方法,要进行定量研究就要涉及文本检索和数据统计。Wordsmith软件中的Wordlist工具可以对语篇的基本信息进行统计,自动生成词表(图1),它可以提供文本中的简略统计数据,从而有助于分析文本的总体统计特征和基本情况。词表的主要统计特征有:文件的字节数(bytes)、形符数(tokens)、类符数(types)、类符形符比(type/图1)The Wizard of OZ的文本统计信息截图(token ratio)、标准化类符形符比(standard type/tokenratio)、平均词长(meanword length)、句子数(sentences)等。形符数指语篇中一共有多少个词。类符数指语篇中一共有多少个不同的词。类符和形符数的比率越高,用词变化性越高。从词表中的形符数和句子数可以看出,该文本是一个相对较短的文本。该文本的类符形符比为7.31,说明该语篇词汇变化量为低等程度。平均词长为4,说明该语篇的用词多为较常见的小词。从上述统计数据中,我们可以初步判定,该语篇用词浅显,句子及篇幅较短,整体难度较低,容易理解。
3基于主题词提取的主要内容分析
主题词提取是通过Keyword List工具实现的,也是AntConc独有的功能。运用主题词提取功能可以提取语篇中的高频词汇和词组,通过分析可以确定主题词和词集,从而对语篇进行初步的了解。但是,这些客观的数据也只是软件浏览所分析出的客观情况,并不能像人为阅读一样能够分清主次。通过观察关键词词表中排在较前的关键词,可以得到该文本的最关键信息。本文选取的参照语料库是The British National Corpus(BNC),该库全部由当代口语及书面语组成,约有一亿个词。本文的主题词表和主题词词图如图2所示。The Wizard of OZ的部分主题词截图从图2的主题词词频(frequency)中可知,“Dorothy”这个词出现的频率是最高的,说明该文本是以“Dorothy”,为中心人物展开的;“said”这个词出现的频率是很高的,说明文本主要由对话组成,所以应该从对话人手分析故事情节和人物形象;主题词表中出现最多的另外三个“人物”分别是“Scarecrow”,“Woodman”以及“Lion”,由此说明这两个人物也是该文本的主要“人物”;此外还有出现频率比较高的“Witch”、“Monkeys”和“Toto”等等。
4基于关键词索引的任务和地点分析
我们利用“语境中的关键词”(KWIC)来对故事中的地点及人物进行进一步的分析。从图2中已经可以很直观地把握出现频度靠前的且有意义的关键词。那么,我们便可以利用Wordsmith的Concord工具对部分主题词进行检索。检索出的关键词前后的词语就构成了一个微小的语境,通过对这些语境的分析,就能对故事中的地点以及人物有一个大概的总览。
由图3可以看出,关于Kansas的句子中大都是“back to Kansas”,这说明这个故事是围绕着怎样回到“Kansas”为中心的。同理,我们如果想要分析“Dorothy”的人物性格,就可以输入关键词“Dorothy”,从而以其上下的语境得出具有价值的信息,如“Dorothy”想要回到家乡的迫切心情和她的勇敢与机智。输入“Lion”,就可以通过其上下语境得出结论,比如说他是个体形庞大但是胆量甚小的形象,不过却能在关键时刻把大家从困难中解救出来。输入“Oz”可以分析出“Oz”在故事中一直是个让人敬仰敬畏的好巫师的形象。
5结语
根据前面的分析,我们不难看出,基于语料库的文学作品分析方法,在操作性以及有效性方面确实更加便捷和准确,省时省力。从这些统计数据中,我们可以客观地掌握文本的基本特征、文本大意以及人物性格,从而对其进行更深刻的分析。在当今如此快節奏的社会,基于语料库的文学分析方法更能满足人们对快捷信息的需求。在有限的时间里,运用这种方法,学生能够快速准确地把握文本的关键。然而,我们也必须认识到其局限性。这种方法仅仅是对传统意义上语篇分析的一种辅助与补充。如果我们既要准确无误而又要详实细微地了解一部文学作品,就不能仅仅依靠语料库分析,而是要在阅读全文后,对其有所了解之后,才有运用语料库分析的意义。并且,对一部作品的理解以及评价都有一定的主观性,如果一味依靠语料库检索软件来分析,不仅使自己的观点故步自封,也是对文学作品的不尊重。因此,在语篇分析的过程中,应该正确运用语料库分析方法,切不可过分依赖。
关键词:语料库;《绿野仙踪》;文本分析
1简介
随着近年来信息技术的发展以及计算机的普及和语料库研究的渐渐升温,国内外不少学者将语料库研究方法应用到文学领域,利用语料库检索软件(Concordance)对文学语篇进行分析,如Conrad、杨建枚、张厚振等。他们的研究大胆创新,十分具有操作性,为后来的文学研究者带来很大的启示。并且语料库研究方法也为英语专业的学习带来了非常大的便利,也节省了资源与时间,是一种高效的研究方法。
《绿野仙踪》又名《奇妙的奥兹男巫》,是美国作家弗兰克·鲍姆创作发表的奇幻冒险童话故事集,共十四本。问世百年以来被翻译成多种语言出版,根据《绿野仙踪》故事改编的动画片和电影更是不计其数。国内常见的《绿野仙踪》是这个系列的第一本。《绿野仙踪》主要讲述了小女孩“Dorothy”和她的小狗“Toto”被龙卷风吹到了一个奇妙的“Oz”(奥兹国),小女孩为了能回到自己的家,经历了一系列有趣又惊现的事情,最后安全回家的故事。
2基于词表的语篇基本情况分析
基于语料库的语言研究一般采取定性与定量相结合的研究方法,要进行定量研究就要涉及文本检索和数据统计。Wordsmith软件中的Wordlist工具可以对语篇的基本信息进行统计,自动生成词表(图1),它可以提供文本中的简略统计数据,从而有助于分析文本的总体统计特征和基本情况。词表的主要统计特征有:文件的字节数(bytes)、形符数(tokens)、类符数(types)、类符形符比(type/图1)The Wizard of OZ的文本统计信息截图(token ratio)、标准化类符形符比(standard type/tokenratio)、平均词长(meanword length)、句子数(sentences)等。形符数指语篇中一共有多少个词。类符数指语篇中一共有多少个不同的词。类符和形符数的比率越高,用词变化性越高。从词表中的形符数和句子数可以看出,该文本是一个相对较短的文本。该文本的类符形符比为7.31,说明该语篇词汇变化量为低等程度。平均词长为4,说明该语篇的用词多为较常见的小词。从上述统计数据中,我们可以初步判定,该语篇用词浅显,句子及篇幅较短,整体难度较低,容易理解。
3基于主题词提取的主要内容分析
主题词提取是通过Keyword List工具实现的,也是AntConc独有的功能。运用主题词提取功能可以提取语篇中的高频词汇和词组,通过分析可以确定主题词和词集,从而对语篇进行初步的了解。但是,这些客观的数据也只是软件浏览所分析出的客观情况,并不能像人为阅读一样能够分清主次。通过观察关键词词表中排在较前的关键词,可以得到该文本的最关键信息。本文选取的参照语料库是The British National Corpus(BNC),该库全部由当代口语及书面语组成,约有一亿个词。本文的主题词表和主题词词图如图2所示。The Wizard of OZ的部分主题词截图从图2的主题词词频(frequency)中可知,“Dorothy”这个词出现的频率是最高的,说明该文本是以“Dorothy”,为中心人物展开的;“said”这个词出现的频率是很高的,说明文本主要由对话组成,所以应该从对话人手分析故事情节和人物形象;主题词表中出现最多的另外三个“人物”分别是“Scarecrow”,“Woodman”以及“Lion”,由此说明这两个人物也是该文本的主要“人物”;此外还有出现频率比较高的“Witch”、“Monkeys”和“Toto”等等。
4基于关键词索引的任务和地点分析
我们利用“语境中的关键词”(KWIC)来对故事中的地点及人物进行进一步的分析。从图2中已经可以很直观地把握出现频度靠前的且有意义的关键词。那么,我们便可以利用Wordsmith的Concord工具对部分主题词进行检索。检索出的关键词前后的词语就构成了一个微小的语境,通过对这些语境的分析,就能对故事中的地点以及人物有一个大概的总览。
由图3可以看出,关于Kansas的句子中大都是“back to Kansas”,这说明这个故事是围绕着怎样回到“Kansas”为中心的。同理,我们如果想要分析“Dorothy”的人物性格,就可以输入关键词“Dorothy”,从而以其上下的语境得出具有价值的信息,如“Dorothy”想要回到家乡的迫切心情和她的勇敢与机智。输入“Lion”,就可以通过其上下语境得出结论,比如说他是个体形庞大但是胆量甚小的形象,不过却能在关键时刻把大家从困难中解救出来。输入“Oz”可以分析出“Oz”在故事中一直是个让人敬仰敬畏的好巫师的形象。
5结语
根据前面的分析,我们不难看出,基于语料库的文学作品分析方法,在操作性以及有效性方面确实更加便捷和准确,省时省力。从这些统计数据中,我们可以客观地掌握文本的基本特征、文本大意以及人物性格,从而对其进行更深刻的分析。在当今如此快節奏的社会,基于语料库的文学分析方法更能满足人们对快捷信息的需求。在有限的时间里,运用这种方法,学生能够快速准确地把握文本的关键。然而,我们也必须认识到其局限性。这种方法仅仅是对传统意义上语篇分析的一种辅助与补充。如果我们既要准确无误而又要详实细微地了解一部文学作品,就不能仅仅依靠语料库分析,而是要在阅读全文后,对其有所了解之后,才有运用语料库分析的意义。并且,对一部作品的理解以及评价都有一定的主观性,如果一味依靠语料库检索软件来分析,不仅使自己的观点故步自封,也是对文学作品的不尊重。因此,在语篇分析的过程中,应该正确运用语料库分析方法,切不可过分依赖。