不论它何时形成,我们今天所知的汉字原来只是用来记录卜筮中的问 与答,这就是上文中提到的甲骨文。甲骨文和商朝国君有密切的关系,起始于武 丁(在位时期:约前1200—约前1181)及其长于卜筮和释卜的亲近顾问。这样,中 国最早的文字是王室专属物,专门指派给史官卜人。然而在近东(西南亚和东北 非),早期的文字有从经济管理到文学宗教等各种用途。不能说甲骨文是出于一种文学意图,它们所触及的仅是君王所感兴趣 诸主题的一小部分,但是有时也显示出某些文学效果,或者预见了后来中国文学 写作的一些特质。下一时期的文字(金文)同样也是如此。金文主要是在周朝,不 过重要的是,汉字在这一阶段已经伴随着青铜器流布到王公贵族一层。而且,现 存最长的金文从甲骨文的十数个字扩展到将近五百字。
随着文本长度的增加,汉字的数量也激增。甲骨文单字总共加起来接 近4500个(包括约1000个异体字),其中仅有1000到1500个字有后世的对应文字。
周朝的金文有差不多4000个单字,其中略超过2400个字是可辨的。由于证据过于 支离破碎,所以很难确定战国时代(前403—前221)丝帛、竹简、青铜和石刻铭文 等中使用的汉字数量,不过肯定是超过了5000个,包括各地使用的许多异体字。
秦始皇在公元前三世纪后期统一六国,“书同文”政策清除了各地的异体字和重复 字,不过不久汉字的数量又再次激增。此后各时代字典收录的汉字个数如下:
9353(100),11520(约227—239),12824(400),13734(500),22726(534),26911(753), 31319(1066)。最近的字典收录了超过六万个汉字,有两部字典甚至收录了超过 八万汉字,而几位北京大学学者甚至计划编写一部罗列超过十万汉字的大字典。
汉字的这种天文级数量对于表音文字使用者而言是不可思议的,因为他们字母表 中的字母通常在20到40个之间。
实际上,汉字的数量是开放的,仍然在不断增长。汉字使用者可以自 由创制新字(许多人这样做了,比如在取名时,或者科学家首次发现未知元素时)。
某个汉字一经创制,它就永久在汉字表中获得一席之地。这迥异于不增加字母总 数而通过重新排列字母来创造新词的表音文字(莎士比亚一个人创造了将近1700 个新词,比如barefaced, castigate, countless, critical, dwindle, excellent, fretful, frugal, gust, hint, hurry, leapfrog, lonely, majestic, monumental, obscene, pedant, radiance, submerged和summit)。也就是说,无论英语中加入多少新词,字母的数目(26个) 是不变的。当然,汉语也可以通过组合语素来增加词汇量,而从来就是这么做的。
比如在官话中,天、花、粉和板四个字可以组合成为“天花”“天花粉”(栝楼根制成 的一种中药)“天花板”等等。实际上这是汉语中创造新词的标准方式,但它没有 阻止新汉字的激增,这部分是因为每个时代都有全新语素产生,不过也是由于人 们希望与众不同,而与众不同的方式之一就是创造新词。
很明显,人们只能记住这些天文级数量汉字中的很小一部分。若要基 本能够识文断字,需要记住1000个汉字,2000—3000个汉字则足以应付大多数环 境,而达到“完全识读”水平(包括读报以及就各种主题进行书面交流)则需要约 4000个汉字。掌握6000个汉字(中文处理软件和常用案头字典所提供的汉字字数)是非常了不起的,而单个人是否掌握1万或者更多汉字则值得怀疑。大多数书写 都习惯性地仅限于使用几千个汉字,这一现象不仅发生在今天,在中国文学的最 高峰唐诗中亦如是。数万汉字中的许多字在历史上仅仅被使用过一两次,它们的 发音或意义(或者二者都)很难确定。然而,字体创建者必须要考虑到这些汉字, 因为它们会不时出现在文本中。信息处理专家必须准备提供至少25000个汉字以 敷日常之用,即便这些汉字中的绝大多数在大多数文本中的出现频率小于十万分 之一,它们仍然不时出现在姓名、历史事件、词汇讨论等中间。
汉字的数量虽然很庞大,但它明显不等同于任何一种汉语中的全部词 汇,也更不等同于所有汉语中的全部词汇。实际上现代标准汉语中的词通常是双 音节的,即便是文言文中也经常使用双音节或者多音节的词或者术语(包括所谓 连绵字、复合字或者复音字、拟声词、同义词,以及其他种类的共同词项)。于 是,虽然汉语被广泛认为是单音节的(由单音节词构成),但是经过对实际使用情 况的细心分析后,我们会发现并非如此。汉语中的绝大多数语素是单音节的,但 是包括英语在内的绝大多数其他语言中的语素也以单音节为主,另外在汉语中 (甚至在文言中)有大量多音节语素,比如“蝴蝶”“蜘蛛”“孑孓”“琵琶”“枇杷”“珊 瑚”“麒麟”“凤凰”“忐忑”“逶迤”和“尴尬”。这些词中的一部分也许在古代是包含复 辅音的单音节字,而语音演化以及随之而来的音位配列导致了汉语中所有复辅音 的分裂。复辅音被再分配在两个相邻音节中,这叫做“一分为二”(dimidiation), 此种双音节化过程似乎在晚近的上古汉语中相当常见。并且一些学者认为,复辅 音的分裂和某些末尾辅音的消失导致了汉语中声调作为一种补偿而诞生。还有一 些学者则提出,这些过程也导致了双音节词数目的激增,使得汉语在面临日趋同 音化时,能确保口语中有足够的词汇差异性,特别是在一些汉方言中的声调日趋 减少的时候(在普通话中,现在只剩下四声:阴平、阳平、上声和去声,但在一 些传统分支如闽南语和粤语中,声调要多得多)。
藏缅语中的对应词研究,以及与印欧语系、南亚语系、南岛语系和其 他语系之间相互的古老借词比较,表明了汉语中原来是有复辅音的。除了上面提 到的语音变动,汉字本身的音节特性也强化了复辅音的分裂,因为世界范围内的 音节文字都展现了一种在结构上单个辅音加元音的大趋势。类似的语音约束,加 之以上提到的对极致简洁的追求,也导致了曾经一度存在于上古汉语中的词形成 分(前缀、后缀和屈折等等)的丢失。而在中古汉语,甚至在现代汉语中,这些丢 失的词形成分在上文提到的阿尔泰化和白话过程中,又得到了复原,区别在于语 法成分不再加于词根之上作为变化,而是作为加于语素音节开头或末尾的单独音 节(书面中则为单独汉字)。
扩展阅读文章
推荐阅读文章
钻爱网 www.zuanai.cn
Copyright © 2002-2018 . 钻爱网 版权所有 湘ICP备12008529号-1