现代汉字字符切分的分离性原则和理据性原则

来源 :汉字文化 | 被引量 : 0次 | 上传用户:kzxs88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文讨论的字符,是指文字本身所使用的符号。学界一般把这种字符分成意符、音符和记号三类。粗略地说,跟字义有联系的字符是意符,跟字音有联系的字符是音符,跟字音和字义都没有联系的字符是记号。现代汉字字符的切分,指的是怎样从一个个单字里切分出字符来。显然,现代汉字字符的切分,既要从形,也要依理。从形就是根据字形,看是否可以切分,也就是是否具有分离性;依理就是根据字的理据进行切分。但是怎样从形,又怎样依理,两者的关系如何,怎样结合,亦即在字符切分的过程中怎样运用分离性原则和理据性原则,尚须进一步讨论。
  
  一、分离性原则
  
  现代汉字字符切分的对象是现代汉字,也就是说现代汉字的字符切分是对现代汉字字形进行切分,切分出相关的字符。因此,就一个个具体的汉字而言,必须从字形上具有可切分性,这就是现代汉字字符切分的分离性原则。
  一般地说,字符要大于笔画,是由笔画和笔画组合而成的,但笔画组合未必就是字符,具有可分离性的笔画组合才有可能成为字符。笔画组合是否具有可分离性,一方面要看笔画组合之间结合的松紧程度,另一方面要看一个笔画组合本身的独立性和整体性情况。
  从笔画组合之间结合的松紧程度看,它们之间结合得越松,可分离性就越强;结合得越紧,可分离性就越弱。笔画组合之间结合的松紧程度首先是由其组合方式决定的。笔画组合之间的组合方式有相离、相接、相交三种。相交的笔画组合,笔画已纠结到一起,无法切分,不能从中切分出字符来。相离和相接的笔画组合都可切分,但是相离的显然优于相接的。相交的笔画组合不能切分,字符必须从相离或相接的笔画组合中切分出来,这是字符切分的一个强制性条件。笔画组合之间的松紧程度,还体现在两个笔画组合是在直线上结合,还是在折线上结合,直线的结合更具分离性。例如“想”应先切分出“相”和“心”两个字符,而不应先切分出“禾”或“目”;“谜”应切分出言字旁和“迷”两个字符,而不应先切分“米”。
  从一个笔画组合本身的情况看,其可分离性表现在它的独立性和整体性程度上。它的独立性和整体性越强,分离的可能性越大。根据笔画组合的独立性程度,可以将其分为成字的笔画组合、通用的笔画组合和孤独的笔画组合三类。成字的笔画组合能够独立成字;通用的笔画组合不能独立成字,却可以在不止一个字里出现过;孤独的笔画组合既不能独立成字,也不能在多个字里出现,而只能在一个字里出现。很明显,成字的笔画组合独立性最强,因而可分离性最强,通用的笔画组合次之,孤独的笔画组合最差。
  笔画组合的整体性,体现在构成笔画组合的笔画之间组合的松紧程度上,笔画之间的松紧程度是由笔画之间的组合方式决定的。我们知道,笔画之间的组合方式有三种,即相交的、相接的和相离的。相交的笔画结合得最紧,由相交的笔画构成的笔画组合的整体性最强,相接的次之,相离的又次之。由相交的笔画或相接的笔画构成的笔画组合都可以成为字符,而由相离的笔画构成的笔画组合必须具备下列条件之一才能成为字符:(1)能独立成字或有通用性,如“心”、“少”、“鼠”的下半,“师”的左半。(2)由内聚的笔画构成的,如“以”的左半,“采”的上半。(3)由平行的笔画构成的,如“巡”的右上,“刘”的右半。因为独立成字和通用说明它们被当作一个整体使用的,笔画的内聚和平行都给人以整体感。
  综合考虑笔画组合之间结合的松紧程度与笔画组合本身的独立性和整体性两方面的情况,我们看到,相离的笔画组合,一般是可以切分的,无论该笔画组合是可以独立成字的,还是可以通用的,或是孤独的。但是两个或两个以上处于相离状态的大体对称的笔画组合的切分都是有条件的,它们有的可以切分,有的则不能切分。切分的条件是,至少要有一个笔画组合能够独立成字,才可切分。这种处于分离状态的大体对称的笔画组合可分为两类,一类是中间没有起对称轴作用的笔画组合的,另一类是中间有起对称轴作用的笔画组合的。前一类如“兆、非、卵、北”等。“兆、非、卵”各自所由构成的两个笔画组合不能切分出来,因为切分出的部分都是孤独的笔画组合。“北”可以切分,因为它的右半能独立成字。值得说明的是,“弱、竹、比”等都可以切分,因为这些字都不属于上述讨论的对称结构,它们都是由两个相同的字符构成的,而不是对称的。后一类如“巫、噩、乖、求”等。“巫、噩、乖”都可以切分,因为“巫”的两个“人”,“噩”的四个“口”,“乖”的“匕”都能独立成字。“求”不能切分,因为它构成对称的两个笔画组合都不能独立成字。这种起对称轴作用的笔画组合,是对称的参照,它既不属于左边的笔画组合,也不属于右边的笔画组合。如果这种对称结构的字可以切分的话,那么中间的组合一定要独立作为一个字符。有时候,这种起对称轴作用的并不是笔画组合,而仅仅是一个笔画,如“水”,这当然不能切分,因为单笔画一般是不能充当字符的。基于同样的理由,即使中间起对称轴作用的是笔画组合,但是如果对称的两部分有一个是单笔画的,也不能被切分出来,整个字只是由一个字符构成的。
  跟相离的笔画组合相比,相接的笔画组合的切分要求更严格一些。这种要求表现为,至少其中要有一个笔画组合能够独立成字或能够通用。例如“男、龙、发、农”等都可切分,“男”的两个字符都能独立成字,“龙”的两个字符都能通用,“发”里的“又”能独立成字,“农”也能切分出一个有通用性的字符来。“豸”不能切分,因为无论怎样切分,被切分出来的两部分都属于孤独的笔画组合。关于相接的笔画组合哪些可以切分,哪些不可以切分,人们的看法并不一致。我们的做法能够使相同的笔画组合得到统一的处理,做到了前后一致,这样可能更为合理。例如上述各字中的能够独立成字的字符和通用的字符,在其他字里都是字符①,那么在“男、龙、发、农”这几个字里也应该是字符。还有一种情况,即与封闭或半封闭结构相接的笔画组合不能切分,所谓半封闭结构相当于一般所说的三面包围结构。例如“月、巨、匆、四、田、自”等不再切分,它们各自都是由一个字符构成的。
  以上讨论的是相离或相接的笔画组合在什么条件下可以切分,这只提供了切分的可能性。现在的问题是,就一个具体的字而言,往往是有多种可能的,在这种情况下到底应该从哪儿切分呢?这可以说是切分的必然性问题。我们认为,在具备多种切分可能的前提下,仅从字形上看,决定切分位置的主要是笔画组合的独立性程度,独立成字的笔画组合优于通用的笔画组合,通用的笔画组合优于孤独的笔画组合,即:成字性>通用性>孤独性。例如“壳”应切分为“士”和“冗”,因为两者都能够独立成字;不应切分出“几”来,因为“几”虽能独立成字,但另外的部分不能独立成字。又如“贞”,应切分成前两笔构成的笔画组合和“贝”这样两个字符,因为“贝” 能独立成字,另一个字符能够通用;不应切分出由前四笔构成的笔画组合和“人”两个字符,因为“人”虽然能独立成字,但另一个笔画组合不具通用性,只是孤独的笔画组合。
  
  二、理据性原则
  
  字符的切分跟部件的切分不完全一样,它不是一种纯字形的切分。字符跟部件的主要区别在于前者跟字音字义联系起来了,而后者不涉及跟字音字义的关系。因此,字符的切分应该考虑切分出的构字成分跟字音字义的联系,跟字音字义有联系的优先切分,这就是字符切分的理据性原则。字符的理据性包括以下几种情况:(1)从单个汉字看其构成成分跟字音字义的联系。(2)类推的意符和音符。例如“紫、绿”都表示颜色,由此推知,它们的共同字符丝字旁/底为意符,表颜色义;“僵、缰、礓、疆”都读jiang,由此推知,它们的共同字符(各字的右半)为音符,表示jiang的读音。(3)从字的源流上认同的异体字符。例如三点水旁和“水”,提手旁和“手”,竖心旁和“心”等为同一字符。
  根据理据性原则对汉字字符的切分不能破坏字形结构。例如“秉”,按照《说文》的解释,为从又(手)持禾,这种解释和该字的现代意义“拿着,握着”仍有关联,但不能据现代汉字的字形切分成两个字符,因为相交的笔画组合不能切分。又如“夷”,《说文》解释为“东方之人也,从大从弓。”“东方之人也”这个意义现代仍在沿用,我们却不能把“夷”切分为“大”和“弓”两个字符。“釜”和“卡”属于另一种类型。“釜”,从金父声,但“金”和“父”的部分笔画已重合在一起,“卡”由“上”的末笔和“下”的起笔重合构成,这种重合的笔画是不能一分为二地切分开的。我们也可以由此看出,造字法和构字法是不同的,现代汉字字符的切分是构字法分析,只能根据现代汉字的字形,从笔画组合之间相离或相接处切分,在任何情况下,都相交的笔画组合都不能切分,这是字符切分分离性原则对理据性原则的一个强制性限制。
  对字符进行切分时,只要满足笔画组合间是相离或相接的条件,就可以充分运用理据性原则了。按照理据性原则对字符的切分有时跟纯字形切分的分离性原则不一致。主要表现在:
  第一,按照分离性原则有多种切分可能,而按照理据原则只能有一种切分。例如“湖”和“冀”,按分离性原则都有三种切分的可能,按理据性原则,“湖”只能切分成三点水旁和“胡”,“冀”只能切分成“北”和“異”。
  第二,按照分离性原则切分的结果与理据性原则不同。例如“旗、颍、腾、徒”,按分离性原则都应切分出左右两部分,按理据性原则,应分别切分出“其、水、马、土”和各自另外的部分。
  又如“楞”和“箍”。按分离性原则,应分别切分为左右和上下两部分。按理据性原则,“楞”可分析为“四方木”,这和该字的现代意义“边棱”仍联得起来,“箍”从竹从手从匝,表示用手将竹篾捆扎成圈儿,所以两个字都应切分为三部分。
  再如“灭”和“伞”。按分离性原则,“灭”不能切分,因为上边的一横是单笔画,而单笔画一般是不能充当字符的;“伞”应切分为上下两部分。按理据性原则,“灭”是个会意字,应切分为“一”和“火”;“伞”是个象形字,整体象形,不能切分。
  当然,按照理据性原则和分离性原则切分字符,多数情况是一致的。这里有一个问题值得提出来讨论。即一个字按照分离性原则应切分为两个或几个部分,但它们都跟字音字义没联系,这种情况按照理据原则是否该切分呢?也就是说,一个字能否仅仅切分为两个或两个以上的记号?例如“它”,如果切分为两个构字成分,它们跟“它”字的字音字义都没联系,“它”是切分还是不切分呢?学界对此看法不一,有人认为可切,有人认为不可切。孤立地看,“它”没有理据,似乎不应切分,但是从整体上和系统上看,我们认为应该切分。理由如下:
  首先,意符和音符都可以两个或两个以上组合成字,为什么记号就不能两个或两个以上一起构字呢?
  其次,同一个笔画组合,又都处在不同的字的第一个层次上,应该得到同样的对待,在甲字里是记号,在乙字里也应该有资格作记号,例如“它”的宝字盖和下边的“匕”在有些字里是可作为记号出现的,在“它”里也应有资格作记号。这样的分析,才符合人们的字感。
  再次,记号很多都能够通用,如果对“它”这类字予以切分,就会使记号的数量大为减少,使我们对汉字的分析和描写既前后一致又简洁清晰。
  最后,从系统上看,记号也是有理据的,它的理据就表现在没理据上,没理据就是它的理据,只不过是它的理据度为零。正如我们说考试时某道题没得分,实际上也是得分,不过是得了零分。又如数学里把直线也看成曲线,直线是一种特殊的曲线,是曲度为零的曲线。
  
  三、结论和余论
  
  理据性原则和分离性原则是汉字字符切分的两个最重要的原则。汉字字符的切分是在遵循分离性原则的在笔画组合相离或相接处切分的前提下,看字符跟字音字义的联系,充分运用理据性原则。上文已讨论过,从整体上和系统上看,完全由记号构成的字也是有理据的。这些记号大都有通用性,它们在别的字里跟意符或音符一起构字时,相对于这些意符和音符,它们也是有理据的,只是它们的理据度为零。意符、音符和记号就是根据理据区分出来的。可见,字符的切分本质上是依理切分,理据性原则是在字符切分中起主导作用的原则。按照理据性原则对汉字字符切分的对象是现代汉字的字形,它不可能是凭空切分,所以,在笔画组合之间相离或相接处切分这一强制性条件,并不能否定理据性原则起主导作用的基本结论。
  切分字符时两种原则运用的顺序是,先找到一个字笔画组合之间的相离和相接处,再看从什么地方切分能和字音字义联系起来,能联系起来的笔画组合就作为字符切分出来。如果跟字音字义没有联系,再根据分离性原则的其他要求加以切分(详本文第一部分)。
  要想对字符进行彻底切分,仅仅靠分离性原则和理据性原则还是不够。据我们考察,字符的切分在遵循理据性原则和分离性原则的基础上,还要遵循二分性原则和平衡性原则。所谓二分性原则,是指切分字符时要尽量二分,减少多分。这主要是由多数汉字是由两个字符构成的强势影响所致,汉字的结构跟语言的结构也有雷同之处,一般可层层二分,正如语言的层次分析尽量二分一样。所谓平衡性原则,是指切分字符时,应尽量保持切分出的两个字符所占空间接近,努力缩小两个字符所占空间的大小差别。例如“皋”应切分出“白”这个字符,不应切分出“十”作为字符。“离”应将前六笔构成的字符切分出来,而不是把前两笔构成的笔画组合切分出来作为字符。关于字符切分的二分性原则和平衡性原则,我们拟另文讨论,这里不再赘述。
其他文献