《现代汉语词典》标“书”词研究(上)

来源 :辞书研究 | 被引量 : 0次 | 上传用户:a954862
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  一、序言
  
  书语词是现代汉语中常出现于书面语,带有典雅、正式、庄重色彩的一类词。《现代汉语词典》(1996年版;下同;以下简称《现汉》)用“<书>”对这类词作了标示,“凡例”的说明是:“一般条目中,标<书>的表示书面上的文言词语。”如:“学子:<书>学生:莘莘(shēnshēn)~(很多学生)。”“嘉许:<书>夸奖;赞许:品学兼优,深得师长~”“凡例”显示标“<书>”的词具有两个特点:一是它的使用范围是书面语,即口语中一般不会用到。二是它的来源是文言词语。为了在行文时加以区分,本文用“书语词”表示一般意义的书面用词语,用标“书”词指《现汉》中作了“<书>”标示的词。
  对词的语体色彩进行标示,是《现汉》的一个重要创举。它还对另两类词语也作了语体色彩标示,“标<方>的表示方言”,“标<古>的表示古代的用法”。这些标示对加强语言分析和理解的准确性,对提高人们使用语言的水平都是有积极作用的。《现汉》的标“书”词有5570条,占全书词目的近十分之一,这个比例是相当大的。那么这数量众多的标“书”词是些什么样的词,它们表达了怎样的意思?传递着怎样的语言交际信息,在汉语词汇体系中居于什么样的地位?这都是值得探讨的问题。值得进一步探讨的是,标“书”词与标了“<古>”的词如何区分?《现汉》的释义中还存在着“旧词语”,用来表示那些正在逐步退出现代汉语使用的词语;还有指称古代事物的词语,即历史词。标“书”词与它们之间又有着怎样的关系?相互之间如何区分?这些都是很值得探讨的问题。最终,当然也就可以回答“标书词”是不是都是“书语词”的问题。这种探讨不仅跟词汇学有关,而且进入了词典编纂学的范围。在词汇学上它将能帮助我们认识汉语词汇系统的内部成分及其关系,在词典学上将有助于词典编纂水平的提高,有助于提高使用者正确运用词语的水平。
  
  二、标“书”词的分布与归类
  
  《现汉》共有标“书”词5570条。现在先来看看这些标“书”词的构成。根据“<书>”标注的词目单位的大小,可分出义项标示与整词标示两类。义项标示的有901条,如“稗”:“(1)稗子。(2)<书>比喻微小、琐碎的:~史。”;整词标示的有4669条,如“陂塘:<书>水塘。”二者分别占16%与84%,后者占了5/6。在整词标示部分又可根据所标示的词目性质,分出“词”、“词素”、“异体字”、“交叉类”四类。下面略加分析:
  1.词。标示对象为“词”,即这个词目具有独立使用的能力。共有3632条,其中单音节词1090条;多音节词2542条,包括出现在单字词目的释义部分中的194条。
  腤 <书>烹煮(鱼、肉)。
  哀荣 <书>指死后的荣誉。
  2.词素。即词目不能独立使用,只是复音词的构成部分。有528条。
  霭 <书>云气:烟~、暮~。
  芸芸<书>形容众多:万物|~众生。
  3.异体字。全部采用“同某”的参见格式,其实是义同形别的异体字。有198例。
  鞌 <书>同“鞍”。
  桮 <书>同“杯”。
  4.交叉类。同一条目中包括有两类以上者。有311例。
  嬖 <书>(1)宠爱~爱|~呢。(2)受宠爱~臣|~妾。(3)受宠爱的人。
  按该例是整词标示,其中义项(1)(2)是词索义,义项(3)是词义。
  呝 <书>(1)同‘呃’。(2)形容鸟鸣声。
  按:该例是整词标示,其中义项(1)是异体字,义项(2)是词义。1.从标示对象单位的大小来看,它除了标示出整词外,还标示出了义项。标示义项的出现表明标“书”的工作做得相当细微,深入到了对各个词义的分辨。
  2.从标示的对象性质来看,既有词,还有词素,还有字。字与“词”、“词素”是很不一样的,像“睾”与“鞍”,更雅致或更古朴,可它们的意思与读音都是一样的,只是写法和传递的色彩不一样。可见,《现汉》对标“书”词的认定是完全从语体风格上来作出判断的。
  值得注意的是,标示对象中“词”与“词素”的差别。“词”是一个独立的使用单位,它的标示,是对它整体的书语词身份与用法的确认。而“词素”的标示则有着不完全一样的功能。当这个“词素”是书面语性质的,但与它共同构词的其他词素是否属于书语词则不定,它所构成的复合性整词是否也必定属于书语词呢?如“霭”是带书语词意味的词素,“烟”、“暮”两个词素不是,构成的“烟霭”、“暮霭”属书语词。可也有不是这样的。如“蕴”是标“书”词,“蕴:<书>(1)包含;蓄积;~藏。(2)事理深奥的地方:底~。”“藏”、“底”不是。构成的“蕴藏”不是书语词,如“蕴藏.蓄积而未显露或未发掘:大沙漠下面~着丰富的石油资源I他们心中~着极大的爱国热情”;而“底蕴”属书语词,如“底蕴:<书>详细的内容;内情:不知其中~”。应该说大多数词素的书语词色彩会影响到整词的色彩。由此亦可见,标词素是一个较为简洁的方法,在理解上也容易抓到关键。
  3.在对“词”的标示中,根据音节的长短,又可分出单音词与多音词两类。单音词有1090例,多音词有2542例。
  从上面的统计中,可看到标“书”词的范围相当宽,涉及的对象也相当复杂。这样的处理隐约显示《现汉》似乎并不太介意标“书”是否完全是针对“词”来作出的判断,尽管“书语词”本来是应该对“词”的语体色彩的一种专有属性的分类,而“词素”,特别是“字”并不属于“词”的范围。在这里映透着人们仍习惯于对汉语最小单位——字的认同。标“书”词的判断也就成了对汉语的基础语言单位的一种色彩、语境、风格的选择与认定。这种色彩、语境或日是风格就是较为典雅,较为僻用,较富文气,而这正是古语词与历史词所同时具有的。那么它们之间有着怎样的关系?这正是诱使我们作进一步探讨的动力之一。
  由于标“书”词的对象过于复杂,在对“书语词”作进一步判断、甄别,特别是在了解书语词的通用程度、适用语境时,为了做到可操作性,提高分析的准确程度,下面作了筛选,只选用“整词标示”部分而没有选用“词义标示”部分,同时为了更好地纯化,选取的又是“整词标示”中的多音节词,共2348例。这里用的为什么不是2542例,是因为排除了只出现在单字释义中的那194例。因此,下面分析所使用的2348例标“书”词,也就具有了“整词”、“多音节词”、“独立词”等特点。
  
  三、标“书”词的词频调查与分析
  
  “凡例”的说明显示出标“书”词具有使用范围是书面语与来源是文言词语的两个特点。这两个特点其实都掩盖不了书语词的另一种很重要的,即断代的共时属性,现实性与通用性应该是书语词所应具有的基本特性。书语词必定会在现实语言生活中呈现一定的使用频率。因此,通过词频调查,我们将能对标“书”词的“现实性”与“通用性”程度有所了解。本文用词频调查的语料是现当代 文学作品,共7000万字,涵盖了现当代文学265位作家的343部长篇和3829篇短篇作品,包括小说、剧本、讲义、散文、杂文、诗歌等题材。之所以只选取文学作品丽没有选用新闻语料,因为文学作品是书语词最适合出现的语境。我们也将它放在10亿字的新闻语料(人民日报)中作过检索,词频明显低于文学作品,这也从一个侧面说明现在的选择是对的。
  先从语料中检索出2348条标“书”词的词频,经过人工初步干预,排除因分词错误、同形异义导致的假频,作了简单的频率统计,
  上表中值得关注的是“百分比”栏,其解读如下:被调查的词中10%的词频只有1次或1次以下;20%的词频在1—3次之间;30%的词频在3—7之间;17次是一个分界线,表明低于或高于它的各占一半。
  以上数据清楚反映了这样一个事实:低频词数量多,频次低;高频词数量少,频次高。有两组数据都有力地支持着这一事实。第一组数据是“平均数”与“中位数”的明显差距。平均数是52.12,中位数是17,说明是少数词的高频率把平均数拉上去了。第二组数据是“百分比”的分布。从低往高处算起,在等距的百分比中,愈是在低位的百分比频距愈小,10%到20%,相差是2,从20%到30%,相差是4,从30%到40%,相差也是4。而在高位的百分比中,频率的数距明显增大。从70%到80%,相差20,从80%到90%,相差55,而90%至最高数(限数),相差4887。
  将所查得的词频按四分位数来切分,可将第一个25%算低频区,第4个25%算高频区,中间的50%算中频区。低频区的词频在1—4次之间,有词语576条。高频区的词频在50次以上,有词语562条。中频区的词频则在5—49次之间,约1210条,占总数的一半。下面对各个频度的词做个简单分析。 1.低频词分析 低频词中无一次出现者204条,如:骈阗、膺选、喧哗、萱堂、儇佻、谱牒、酸醅、勖励、讯步、诮呵、牙侩、崖略、皮傅、獠、狂狂、披怀,等。
  出现1次者,如:谐戏、重趼、奥博、佻薄、刑辱、俦类、商兑、佻巧、弋获、驰骛、驰目、欣忭、颓放、滚滚、穰穰、荏弱、蜷局、潭府、岁杪,等。
  出现2次者,如:践诺、枭将、参错、阆苑、悠谬、廓张、并骨、拿陋、笃志、魁元、快然、津梁、诧愕、杳渺、蠡测、伶俜、荫翳、炳蔚、沮遏,等。
  出现3次者,如:厕足、赅括、仓禀、湔洗、剿袭、鹣鲽、俎上肉、蔼蔼、谙练、听讼、倜然、讹夺、傥荡、探胜、陂塘、佛戾、岁除、笔受、拂煦,等。
  我们之所以将这些低频词按出现的频次细细缕列,是因为这样可以清楚地告诉我们这些词已经很难与当代词语联系起来了。它们已经基本丧失了“当代性”与“通用性”。除极少数以外,大部分应该说已经退出了现代汉语的使用范围。
  2.中频词分析
  中频词的频次范围在5—49之间,下面来看看频次为30的词,共25条。它们是:恢恢、逋逃、不韪、粲然、昌言、芳邻、父执、赴敌、率尔、强颜、漪澜、秉烛、鸿儒、宅第、噍类、阑干、离析、受业、挞伐、怃然、宵旰、修明、羞赧、延揽、苟同。中频词都有一定的语言使用频率在支撑着它们,人们对它们有一定的熟悉度。这种熟悉程度与语言使用者的文化水平有密切关系,这是符合书语词特点的。
  3.高频词分析
  高频词的词频数在50以上,共有562条。居于中位的是词频为100次的高频词。词频数在99~103次之间的有16个词:陵寝、人杰、归田、何谓、进谗、倍道、子虚、教化、更始、恻隐、羁縻、艳羡、行囊、不才、旧家、手谕。
  通过上面对三个频度的例词分析,我们已经可以清楚地感受到低频、中频、高频三类标“书”词在现实语料中的使用情况。至少可以说,500余条的低频词已基本丧失了生存能力。中频词、高频词则得到了相当数量语言事实的支持。
  为什么在标“书”词内部,词与词之间的“现实性”与“通用性”差异会如此之大?可能有这样两方面的原因.第一个原因可能是语料不当,或过于生僻,以致它们难以出现,或过新过俗,不属它们的生存环境。但从对语料的构成分析来看,这个原因基本上可以排除。因为这些语料的作者既有较早的鲁迅、老舍、曹禺、叶圣陶、茅盾、林语堂、巴金、冰心,又有承上启下的邓友梅、孔捷声、路遥、姚雪垠,也包括了新时期的梁晓声、刘心武、陈忠实、高晓声、阿城、池莉、孔庆东、阿成、艾晓明、莫言、毕淑敏等,应该说对现当代各个时期的文学语言有相当的代表性。第二个可能的原因就是词语本身。如果在代表一种语言精华的文学作品中都难觅踪影,这样的词语恐怕很难算得上是书面语了。
其他文献
摘 要 文章对《现汉》标注词类的有关问题作了较为详细的说明。全文分为三个部分。第一部分介绍《现汉》标注词类所采用的词类系统和各类词的语法特点;第二部分讨论词与非词的区分,指出《现汉》是在区分词与非词的基础上给单字条目和多字条目标注词类的,并对如何区分词与非词作了具体的说明;第三部分讨论疑难问题,就几个容易产生分歧的问题提出了处理办法和这样处理的理由。  关键词《现代汉语词典》 词类 词类标注 语法
期刊
摘 要 《明清吴语词典》全面展示了明清吴语词汇的面貌,资料丰富,收词齐全;考释精当,义项完备;体例合理,便于使用。既是一部高质量的断代方言词典,又可看作是一部有特色的近代汉语词典。  关键词 《明清吴语词典》 特色成就  2005年1月,由石汝杰和宫田一郎两位先生主编、十几位吴语研究专家参编的苏州大学和日本北陆大学合作研究项目最终成果《明清吴语词典》,终于由上海辞书出版社出版发行了。该词典全方位地
期刊
从本期起,《辞书研究》恢复为双月刊,并以原国际刊号ISSN1000—6125和新的国内统一刊号CN 31—1997/G2出版。  由于某种原因,本刊自2001年起曾改用书号出版,让人感动的是,在《辞书研究》以书号出版的这几年中,不少老朋友、老作者仍一如既征地给刊物投寄高质量的,稿子,也有不少新作者、新朋友陆续加入本刊的作者团队,保证了本刊的稿源,帮助本刊学术研究水准,从而成为“CSSCI来源集刊”
期刊
摘 要 图像作为百科全书的组成部分,在各类知识主题阐释中与文字具有同样重要的作用。但在具体的编纂中,人们却往往忽略了它的知识含量和文献价值,仅将其视为文字阐释的附属。本文针对这一问题,从学科知识的构成与百科全书的本体特征出发,就图像的种类、图像文献价值的多义性、图像内容与形式的多样性、图题的稳定性意义与图注内容的随机性变化,以及图像与文字阐释的相互关系等问题,作了初步的尝试性探讨。  关键词 百科
期刊
摘 要 《中文核心期刊总目要览》(第四版)学科分类日臻完善,指标调整合情合理,观点阐释一分为二,内容组合珠联璧合,体现了工具书编纂后出转精的特点。该书在核心期刊的著录等方面也还存在某些不足。  关键词 《中文核心期刊总目要览》 核心期刊 研究评述  期刊的编辑、出版,期刊的收藏、保管,期刊信息的整合、开发,期刊信息资源的传播、利用,——是一项系统工程。期刊的生产、管理与利用,是环环相扣、息息相关的
期刊
摘 要 文章从调整收词、修订释义、加强规范三个方面阐述了第5版《现代汉语词典》科技条目修订的思路与实践。调整收词,既要增新,也要删旧,从中体现辞书的时代性;修订释义,既要符合语文词典修订的一般原则,又要注意科技条目自身的特殊性;加强规范,既要贯彻国家的语言文字规范,也要遵从国家的科技术语规范。  关键词 《现代汉语词典》 科技条目 修订    第5版《现代汉语词典》(下简称《现汉》)科技条目的修订
期刊
bǎndèng  ①(bench for substitutes[of amatch])原是指球场边上的坐具。因替补队员上场机会少,常坐在板凳上,故而“坐板凳”用来表示“是/成为替补队员”。如《人民日报》1991年4月28日:“27日上午,男子团体B组中国队对德国队的比赛,战表一亮,双方不谋而合。中国队一直坐板凳的于沈潼和王涛出场,德国队也启用没露过面的弗兰茨和沃斯克,跟着名将费兹奈尔迎战。”《人
期刊
摘 要 平行语料库的建设既要体现出一定的目的性,也要具有一定的规模。“大胆怀疑,小心求证”,这种自古流传下来的科学研究方法,对于我们编辑和使用语料库中的语料不乏借鉴之处。  关键词 汉英词典 平行语料库 词目译义 求证    汉英词典的核心工作是译义;译义的基础是词典编者拥有大量的语言材料。钱厚生先生指出:“真正贴切的对应词大多存在于好的翻译材料之中,值得大力搜寻。双语词典编者应当广泛收集翻译材料
期刊
将模特与商品结合在一起,是当下营销文化的一个趋势,由此产生了缩略式的“模”族新词。“模”作为构词成分似也越来越能产。下面几个是常见的“模”族新词。    车模(car model)  chēmó    汽车模特。即为汽车展示、销售工作的模特。如《北京青年报》2000年6月13日:“在8号馆的本田展台上,所有车模集体上台隆重谢幕,引来许多人的围观。”《北京娱乐信报》2002年6月13日:“车展上的模
期刊
中国辞书事业如何持续发展繁荣,中国如何从辞书大国迈向辞书强国,这是每个辞书人都在思考的问题。在中国辞书学会第七届年会召开之际,笔者结合学习科学发展观的体会,想就此谈谈个人的一些思考。    一    辞书编纂与语言文字规范化关系非常密切,从古代的石经、“字样”之书、各类辞书到近现代“成文化”的语言文字规范标准出现,昭示着时代的进步。  新中国成立以来,国家有关部门陆续发布了130多项语言文字规范标
期刊