论文部分内容阅读
本文是从发现程序的角度探讨语言习得机制的理论性研究。‘发现程序’由美国结构主义语言学家的代表人物之一Harris提出,目的是用高度形式化的方法确定语言的基本单位:音位和语素,从复杂的语义中提取出语言形式中的规律和模式,减少语法的冗余。发现程序包括切分程序、分类程序、替换程序、同现程序等。林允清认为,每一个心智正常的人都清楚、清醒地知道本族语的语法。儿童并不是生来就有一套先天的普遍语法,而是具有一种先天的语言习得机制——发现程序,这些程序使得儿童能够在输入的语料中识别规则和型式,从而习得语言。
本文讨论了语言和发现程序的本质。语言是约定俗成的惯例,是人们讲述经验、表达思想的习惯方式,每个人都清楚的知道本族语的语音和语法。而发现程序被设想为先天的语言习得机制。接着,本文用三个方法来验证和发展发现程序作为语言习得机制这一设想。
首先,我们用儿童语言发展中的研究成果来对比和补充发现程序发现语音和语法的过程。我们设想儿童习得语言的过程跟早期的语言学家找到语言中的音位和语素类似。由任意把言语切分成单位开始,再根据更多的言语输入来调整,发现并存储重复出现的模式,把它们归类为有效的语言单位,接着合并为更高一级的单位。通过反复试验,儿童逐渐习得母语的语音和语法结构。最小对比对(minimal pairs)不仅对语言学家发现语音和语法非常有用,对儿童习得语言也同样重要。当儿童能够在日常交流中判断两个看似相近的言语是否相同的时候,他们已经开始习得语言了。
我们进一步设想,在两词话语短语结构的基础上,儿童通过替换、扩充、移位、同现、结合、嵌入、错误纠正等机制,习得基础句法结构,并不断叠加复杂化。
其次,为了证实和发展这一理论假设,Harris的发现程序将被应用于语料分析。在一个英语语料的背景下分析一篇英语短文,生成不同等级的语法单位,并与我们已知的英语语法相对比。
我们的分析从最容易识别的单词入手。一个单词包括一个或多个语素。我们分析短文中的单词在语料中的分布,并互相对比,查找规律。
本文用到了Harris的三个程序。‘独立和模式化组合’程序找到可能切分的语素段。‘平衡独特的语素段’程序把互补的一系列语素段视为一个语素。‘大体相似的环境’或‘在环境中的语素类’程序将分布规律相似的语素归类。通过与已知的语法相比对,发现程序被进行进一步的补充和调整。
最后,本文设计出两个计算机程序来模拟发现程序发现语言规律和模式,用严谨的方式来验证发现程序作为语言习得机制的可行性。第一个计算机程序从语料中读出不同的字母、数字和标点符号,并计算它们的出现次数。第二个计算机程序能根据我们的设定找出语料中含有一个或多个后缀的一组组单词,并判断词根是否在语料中单独作为单词出现。例如,如果我们输入后缀:-ent,-ently,-ence,在语料中我们能够得到类似:confident,confidently,confidence;different,differently,difference;present,presently,presence这样一组组的单词,并判断字母组合confid,differ,pres在语料中是否是一个独立的单词。这一程序帮助我们识别语素的分布规律,并把有相似规律的语素归类。
这两个程序只是一个前期的工作,我们的目的是设计出一个计算机模型,模拟语言习得的全过程。使得计算机能够在大量的语言输入的基础上,自动生成语法。这可以进一步证实发现程序作为语言习得机制理论的可行性。
发现程序作为语言习得机制这一设想提供了另一个解释人类语言秘密的途径。而这一新的理论仍处于起始阶段,值得我们进一步研究。