论文部分内容阅读
文章对北京大学中文系和北京大学计算语言研究所《现代汉语语法信息词典》(电子版)里除成语和惯用语的40778个双音节、多音节词进行分析和统计。排除单纯词、专名、音译词和结构关系不明的词等共1324条,对剩下的39454个词逐一进行构词方式、构成成分的素性和核心的确认等分析,坚持人工和机器、定性和定量、内省和实证相结合的研究方法,探讨汉语合成词的构词模式对合成词语法属性的影响及相关问题。 合成词的构词方式与词性没有必然的关系,仅是一种倾向性。文章用核心属性同化理论来说明合成词中核心成分的语法属性会同化整个合成词,从而决定了合成词的词性。统计表明,39454个词中有90%以上的合成词都符合核心属性同化规则。只有不到10%的合成词不符合核心属性同化规则,文章用核心属性异化来解释这种现象,即合成词的核心成分的语法属性同化合成词时发生变化,使合成词整体的词性与核心成分的素性并不相同。文章称符合核心属性同化规则的合成词为向心词,称发生核心属性异化的合成词为离心词。随着词语使用频率的不同,合成词的内部构造对合成词词性的影响程度不一样,越是使用频率高的词汇其核心属性同化率越低,越是使用频率低的词汇其核心属性同化率越高。这表明,汉语词汇的使用频率与核心属性同化成反比。在对外汉语词汇教学过程中应该注重语言教学中的词量控制和选择。 文章另外收集了汉语中值得重视的新词缀化所造成的新派生词包括920个“化”缀词,808个“性”缀词和840个“式”缀词,共计2568个,并对其语法属性进行考证,证实了这些新生词汇的核心属性同化情况分别达到89.13%、100%和99.06%,进一步论证了汉语新派生词绝大部分是符合核心属性同化的向心词。这对于提高中文信息处理效率具有一定的帮助作用。