论文部分内容阅读
本文以基本统计原则从实证层面讨论计算文学研究中的14篇学术作品,讨论其中所涉及的数据的性质以及导致研究结果的统计工具,指出这其中一系列的技术问题、逻辑谬误和概念缺陷。将所选择的计算文学研究分为两种类型:一种是统计方法严谨,然而并没有提出和解决有意义的学术问题;一种是看似解决了有意义的学术问题,然而或者统计方法并不严谨,或者并没有必要使用统计学和其他机器学习工具。本文通过探讨这些文章所使用的数据以及所使用的计算方法,试图去神秘化计算工具在文学语料库中的应用,重提文学语言修辞和阐释的复杂性,得出的结论是:计算文学批评的方法论和理论前提并不适用于分析文学、文学史和语言学的复杂性。