基于语料库的儿童文学的语篇分析

来源 :科学导报·学术 | 被引量 : 0次 | 上传用户:guiminzhu18
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:本论文将使用语料库检索软件,对美国作家弗兰克·鲍姆(Frank Baum)创作的儿童文学作品《绿野仙踪》的文本特征、主要内容等方面进行分析,以展示语料库检索软件在文学分析方面的强大功能,提高英语专业大学生对英语文学学习的兴趣,促进他们的英语学习。
  关键词:语料库;《绿野仙踪》;文本分析
  1简介
  随着近年来信息技术的发展以及计算机的普及和语料库研究的渐渐升温,国内外不少学者将语料库研究方法应用到文学领域,利用语料库检索软件(Concordance)对文学语篇进行分析,如Conrad、杨建枚、张厚振等。他们的研究大胆创新,十分具有操作性,为后来的文学研究者带来很大的启示。并且语料库研究方法也为英语专业的学习带来了非常大的便利,也节省了资源与时间,是一种高效的研究方法。
  《绿野仙踪》又名《奇妙的奥兹男巫》,是美国作家弗兰克·鲍姆创作发表的奇幻冒险童话故事集,共十四本。问世百年以来被翻译成多种语言出版,根据《绿野仙踪》故事改编的动画片和电影更是不计其数。国内常见的《绿野仙踪》是这个系列的第一本。《绿野仙踪》主要讲述了小女孩“Dorothy”和她的小狗“Toto”被龙卷风吹到了一个奇妙的“Oz”(奥兹国),小女孩为了能回到自己的家,经历了一系列有趣又惊现的事情,最后安全回家的故事。
  2基于词表的语篇基本情况分析
  基于语料库的语言研究一般采取定性与定量相结合的研究方法,要进行定量研究就要涉及文本检索和数据统计。Wordsmith软件中的Wordlist工具可以对语篇的基本信息进行统计,自动生成词表(图1),它可以提供文本中的简略统计数据,从而有助于分析文本的总体统计特征和基本情况。词表的主要统计特征有:文件的字节数(bytes)、形符数(tokens)、类符数(types)、类符形符比(type/图1)The Wizard of OZ的文本统计信息截图(token ratio)、标准化类符形符比(standard type/tokenratio)、平均词长(meanword length)、句子数(sentences)等。形符数指语篇中一共有多少个词。类符数指语篇中一共有多少个不同的词。类符和形符数的比率越高,用词变化性越高。从词表中的形符数和句子数可以看出,该文本是一个相对较短的文本。该文本的类符形符比为7.31,说明该语篇词汇变化量为低等程度。平均词长为4,说明该语篇的用词多为较常见的小词。从上述统计数据中,我们可以初步判定,该语篇用词浅显,句子及篇幅较短,整体难度较低,容易理解。
  3基于主题词提取的主要内容分析
  主题词提取是通过Keyword List工具实现的,也是AntConc独有的功能。运用主题词提取功能可以提取语篇中的高频词汇和词组,通过分析可以确定主题词和词集,从而对语篇进行初步的了解。但是,这些客观的数据也只是软件浏览所分析出的客观情况,并不能像人为阅读一样能够分清主次。通过观察关键词词表中排在较前的关键词,可以得到该文本的最关键信息。本文选取的参照语料库是The British National Corpus(BNC),该库全部由当代口语及书面语组成,约有一亿个词。本文的主题词表和主题词词图如图2所示。The Wizard of OZ的部分主题词截图从图2的主题词词频(frequency)中可知,“Dorothy”这个词出现的频率是最高的,说明该文本是以“Dorothy”,为中心人物展开的;“said”这个词出现的频率是很高的,说明文本主要由对话组成,所以应该从对话人手分析故事情节和人物形象;主题词表中出现最多的另外三个“人物”分别是“Scarecrow”,“Woodman”以及“Lion”,由此说明这两个人物也是该文本的主要“人物”;此外还有出现频率比较高的“Witch”、“Monkeys”和“Toto”等等。
  4基于关键词索引的任务和地点分析
  我们利用“语境中的关键词”(KWIC)来对故事中的地点及人物进行进一步的分析。从图2中已经可以很直观地把握出现频度靠前的且有意义的关键词。那么,我们便可以利用Wordsmith的Concord工具对部分主题词进行检索。检索出的关键词前后的词语就构成了一个微小的语境,通过对这些语境的分析,就能对故事中的地点以及人物有一个大概的总览。
  由图3可以看出,关于Kansas的句子中大都是“back to Kansas”,这说明这个故事是围绕着怎样回到“Kansas”为中心的。同理,我们如果想要分析“Dorothy”的人物性格,就可以输入关键词“Dorothy”,从而以其上下的语境得出具有价值的信息,如“Dorothy”想要回到家乡的迫切心情和她的勇敢与机智。输入“Lion”,就可以通过其上下语境得出结论,比如说他是个体形庞大但是胆量甚小的形象,不过却能在关键时刻把大家从困难中解救出来。输入“Oz”可以分析出“Oz”在故事中一直是个让人敬仰敬畏的好巫师的形象。
  5结语
  根据前面的分析,我们不难看出,基于语料库的文学作品分析方法,在操作性以及有效性方面确实更加便捷和准确,省时省力。从这些统计数据中,我们可以客观地掌握文本的基本特征、文本大意以及人物性格,从而对其进行更深刻的分析。在当今如此快節奏的社会,基于语料库的文学分析方法更能满足人们对快捷信息的需求。在有限的时间里,运用这种方法,学生能够快速准确地把握文本的关键。然而,我们也必须认识到其局限性。这种方法仅仅是对传统意义上语篇分析的一种辅助与补充。如果我们既要准确无误而又要详实细微地了解一部文学作品,就不能仅仅依靠语料库分析,而是要在阅读全文后,对其有所了解之后,才有运用语料库分析的意义。并且,对一部作品的理解以及评价都有一定的主观性,如果一味依靠语料库检索软件来分析,不仅使自己的观点故步自封,也是对文学作品的不尊重。因此,在语篇分析的过程中,应该正确运用语料库分析方法,切不可过分依赖。
其他文献
急性腹膜炎是腹部外科常见的急腹症,是指腹腔脏层腹膜和壁层腹膜的炎症,可由细菌、化学、物理损伤等引起。其发生和发展受病因的种类和性质、以及原发病灶的部位、细菌的种类和
摘 要:中国译学构架中外宣翻译研究一直是个极为薄弱的环节,借助语料库对语料库数据驱动的商科院校外宣资料的英译研究有利于商科院校的对外宣传以及自身发展。语料库翻译学的研究课题主要有三个:翻译共性,翻译文体,翻译过程。  关键词:语料库;数据驱动;外宣翻译  一、语料库翻译学作为翻译研究新的分支学科发展  20世纪90年代初语料库的迅速发展,使语料库同翻译研究的结合成为自然的现象。正如意大利Lavio
会议
如何培养学生"三创"(创新意识、创新思维、创新能力)综合素质呢?本人结合儿童学习的认知规律,在"创设情境、引探导学、点拨促思、拓展迁移"等方面做了一些有益的探索,总结了一套数学
无籽西瓜种子种皮较厚,种胚发育不完全,播种前必须浸种或破壳、催芽,最好采用温床或电热线加温育苗;苗期注意温湿度管理,定植前炼苗防徒长,配置合理的授粉植株,适时采收防止空心或倒
本文在对乒乓球训练的统筹安排、差别对待相结合原则、循序渐进、逐步提升原则以及基础素质训练与专项素质训练相结合原则进行分析的基础上,简述了乒乓球运动训练过程中,常见
电力系统整体上比较复杂,线路、设备等需要按照说明来安装并正确使用,但是经常会出现错误操作的情况,这对于供电环节乃至于工作人员的安全都有重大的负面作用。所以,在网络相
针对学生撰写综述时存在的一些问题,在药物分析课程中引入PBL教学法,以解决综述撰写过程中出现的各种问题。
有机残余(主要是苯并三氮唑(BTA))和铜表面腐蚀是多层铜布线化学机械抛光(CMP)后晶圆缺陷中的两个重要问题,针对BTA去除和铜表面腐蚀抑制提出了一种新的碱性清洗剂。该清洗剂
实验室管理水平的高低直接影响实验室功能的发挥,影响高校的教学、科研水平,数字化管理是未来实验室管理的趋势,该文对实验室数字化管理建设进行了深入的探索.