漢字的歷史故事(2)
漢字的歷史故事
漢字的歷史故事之漢字的特性
正如上文所提到,文字不等于語言,語言不等于文字。某種特定文字可以用來書寫多種不同而彼此無關(guān)的語言(比如英語、土耳其語、越南語和印尼語都用羅馬字來書寫),而某種特定語言也可以用不同文字來書寫(如維吾爾語根據(jù)歷史年代排序曾用過以下文字來書寫:盧恩文字[runes]、古回鶻文字[起源于阿拉米文字,經(jīng)由粟特草體演變而來,是蒙文字和滿文字的祖先]、阿拉伯文字、西里爾文字、羅馬文字,然后又再是阿拉伯文字)。因此文字的分類與語言的分類是無關(guān)的,反之亦然。漢語的分類上面已經(jīng)討論過了,本節(jié)主要對(duì)漢字進(jìn)行分類。
對(duì)于該給漢字貼上什么樣的標(biāo)簽,仍舊未有定論。雖然在非專業(yè)文獻(xiàn)中,經(jīng)常把漢字稱為“象形文字”,這是非常不正確的,因?yàn)橹挥幸恍〔糠譂h字如山、日、馬、鳥、魚、龜,在創(chuàng)制之初是有意仿照事物樣子的。即使是這一小部分象形字,其現(xiàn)在的字形,對(duì)于不熟悉漢字的人來說,也完全辨認(rèn)不出來它們的象形對(duì)象。同樣只有一小部分漢字——如“上”“下”和“中”等等——是表意的,而且只有接受過專門訓(xùn)練的人才能辨識(shí)出它們的表意之處。所以將漢字稱為表意文字也不妥當(dāng)。許多權(quán)威專家比較接受“意符文字”(logographic)這個(gè)提法,這意味著漢字的每個(gè)音節(jié)單位都等于一個(gè)詞,因而漢語是單音節(jié)的。對(duì)漢字的更準(zhǔn)確描述應(yīng)該是語素音節(jié)型(morphosyllabic),這指的是每一個(gè)漢字單位在長度上都是單音節(jié),傳遞一個(gè)基本意思。這里要重申的是,漢字的基本音節(jié)特性不能用來宣稱所有漢字只包含一個(gè)音節(jié)。學(xué)者們使用語法分析、心理語言學(xué)和其他方法結(jié)論性地表明,除了漢字,漢語使用者對(duì)于其他單詞的不同音節(jié)長度也有一種明白無誤的感覺。
誠然,漢字基本上是單音節(jié)的,但還是有些例外,因?yàn)榇_實(shí)存在一些具有多個(gè)音節(jié)的漢字(有些可追溯到唐朝,甚至更早)。在這種所謂“合文”的漢字中,有比如“茾”(菩薩)、“”(菩提)、“”(涅槃)、“”(某乙)、“”(營田[使])、“瓩”(千瓦)、“”(問題)、“邗”(干部)、“”(社會(huì)主義)、“圕”(圖書館)(這些漢字當(dāng)然也可以用多個(gè)漢字寫出來),有些合字被廣泛使用,甚至今天還能在標(biāo)準(zhǔn)字典中找到。在二十世紀(jì),超過1000個(gè)這樣的多音節(jié)漢字被廣泛使用,這清楚地說明了漢語使用者有一種漢語并非完全單音節(jié)的天然的認(rèn)知。這些多音節(jié)漢字多為代替許多常用詞匯,所以這也預(yù)示著簡化漢字的內(nèi)心愿望。
另一個(gè)從十世紀(jì)后半期一直持續(xù)到十九世紀(jì)末的相關(guān)現(xiàn)象,是反切的使用。這是一種受佛教啟發(fā)的注音方法,用兩個(gè)漢字合起來為另一個(gè)漢字注音。反切時(shí),通常寫做“X Y反”,這表示X(反切上字)注聲母,Y(反切下字)注韻母和聲調(diào)。有時(shí)“X Y反”(三個(gè)字)經(jīng)常寫做“XY”(一個(gè)字)。在這種情況中,兩個(gè)漢字就合成了一個(gè)漢字。這再次顯示了,中華帝國晚期的學(xué)者不僅能進(jìn)行語音分析——這一分析具有發(fā)展成真正拼音的潛力,而且顯示了漢字體系并非毫無變通即注定是單音節(jié)以及單語素的,漢語更是如此。
實(shí)際上,在已知的最早漢字(甲骨文)中,兩個(gè)甚至三個(gè)音節(jié)寫成一個(gè)漢字的情況并不罕見,比如“乙祖”、“三萬”、“十五發(fā)”所對(duì)應(yīng)的甲骨文字。周朝的金文中雙音節(jié)漢字不乏其例,如“小子”“小臣” “武王”和“文王”對(duì)應(yīng)的金文。這些證據(jù)表明,在中國文字的最早階段中,仍然有清晰的認(rèn)識(shí),即文字(和明顯的詞匯單位)是可以有一個(gè)以上的音節(jié)的。然而到了秦漢時(shí)期,漢字的單音節(jié)化趨勢(shì)將有保留和傳承價(jià)值的文本中的雙音節(jié)字和多音節(jié)字幾乎鏟除殆盡。不過詞匯單位可以是多音節(jié)的這一直覺還是保留著的,所以多音節(jié)漢字仍在不斷被創(chuàng)造出來,如“不要”“二十”“三十”和“四十”的對(duì)應(yīng)字。但是由于忠實(shí)于漢字單音節(jié)限制的壓力太過強(qiáng)大,這些表達(dá)的合音和別的特定發(fā)音便孕育而生(分別是“甭”“廿”“卅”“卌”)。不過許多漢字雙音節(jié)和多音節(jié)特質(zhì)是不可否認(rèn)的。而且上面提到過,許多漢語語素不止包括一個(gè)音節(jié),因此在漢字的基本單位同時(shí)傳遞語音與語義的意義上,我們最好認(rèn)為漢字是語素語音型或語義語音型(而非簡單稱之為語素音節(jié)性),而漢字的長度并不必然是單音節(jié)的。
不管我們將漢字完全稱為意符型、語素音節(jié)型,還是語素語音型/語義語音型,大多數(shù)漢字(約85%,即形聲字)都由一個(gè)傳達(dá)語音的部分(聲旁)和一個(gè)傳達(dá)意義的部分(形旁)構(gòu)成。不過聲旁和形旁都不會(huì)準(zhǔn)確告訴讀者這個(gè)漢字的意思或者發(fā)音,而只是給出大略近似于該字的字義和字音。比如,讀者也許會(huì)碰到一個(gè)字,它的形旁是三點(diǎn)水。三點(diǎn)水意味著這個(gè)漢字極有可能(但不必然)與水或者液體有關(guān),這樣我們會(huì)猜這個(gè)字也許意思是“浪”“濺”“淺”,等等。但是,僅僅從三點(diǎn)水來判斷,我們不可能確定這個(gè)字的確切含義,只能得出這個(gè)字與水及其引申義沾親帶故。帶三點(diǎn)水的漢字超過2000個(gè),詞義紛呈,從潔到汽、河、游、漁、泡、消、汁、液、油、酒、溝、淌、瀉、沫、濕、滯、泥、淫、淚和澳,等等。僅僅辨識(shí)出一個(gè)漢字的形旁,在實(shí)際判斷其詞義的時(shí)候不一定會(huì)派上很大用場(chǎng)。同樣的,讀者可能會(huì)碰到一個(gè)漢字聲旁為“方”(其四聲代表的意思有很多,如方、妨、仿、訪、舫、放、芳、枋等),而它的形旁表示它和“門”有關(guān)。只有將聲旁和形旁連起來看,有經(jīng)驗(yàn)的讀者才能明白這個(gè)字讀fang的第二聲,它的意思是“房子,建筑物”。這一詞素在文言文中是單獨(dú)出現(xiàn)的,不過在現(xiàn)代標(biāo)準(zhǔn)漢語中與名詞后綴或者一個(gè)同義字組成雙音節(jié)詞,比如“房子”、“房間”和“樓房”。另外,要確定某個(gè)漢字的意思,我們必須暫時(shí)忘記聲旁(如“方”)自身也可以作為形旁,例如在於、施、游和旗等漢字中。在“旁”這個(gè)漢字中,“方”既是聲旁也是形旁。
另外,許多形聲字不止有一個(gè)讀音,這很難用語音衍生過程來簡單解釋。比如上面提到的“施”字,實(shí)際上有下述多種讀音:shī(施行),yí,yì,shǐ。在這種情況下(有兩個(gè)及以上讀音的漢字即“破音字”或“多音字”數(shù)以千計(jì),其中最多的有十一種讀音),讀者必須在上下文中用直覺來判斷某個(gè)字的確切讀法和意思。
必須要指出的是,形聲字是相對(duì)容易處理的漢字。讀者要辨識(shí)剩下15%—20%的漢字,必須完全靠記憶從字形中抽取語音和語義。
雖然形聲字有上面提到的種種復(fù)雜特性,但是它們的優(yōu)勢(shì)地位極大地支持了為漢字貼上單音節(jié)或者語素語音的標(biāo)簽。而且因?yàn)樾温曌值穆暸允歉匾牟糠?,漢字可以在基本上被視為一種附加了語義成分的音節(jié)或者語音文字體系。它由一張非標(biāo)準(zhǔn)的音節(jié)表所構(gòu)成,若被標(biāo)準(zhǔn)化,現(xiàn)代標(biāo)準(zhǔn)漢語的所有音節(jié)可以在有聲調(diào)的情況下用約400個(gè)漢字,或者在忽略聲調(diào)的情況下用1300個(gè)漢字涵蓋。在通用計(jì)算機(jī)字庫中并不是這種簡單的1:1對(duì)應(yīng),漢字和音節(jié)的比率為5:1或者16:1(后者考慮了聲調(diào))。這可以與類似的非標(biāo)準(zhǔn)化英文體系中約40個(gè)音素的15:1到40:1這一比率形成比較,英文中像sent, cent和scent這樣的語義—語音詞段也為英語貼上了語素語音文字體系的標(biāo)簽。
當(dāng)我們了解到漢字體系包含了超過4萬個(gè)兼具語音與語義的獨(dú)立單位,便會(huì)很明顯認(rèn)識(shí)到漢字是一種令人費(fèi)神的文字。只有花費(fèi)大量時(shí)間,才能達(dá)到熟練掌握的程度。甚至像寫下“打噴嚏”這樣常用的詞,都會(huì)遇到難以預(yù)期的困難,連中國人(除了漢字能力強(qiáng)的人)都很少能完全正確地寫出來。中國西部約占全國六分之一國土的維吾爾自治區(qū)——新疆的“疆”字有十九畫,也讓很多人不堪其擾。灰心至極的他們,要么丟掉右邊聲旁的上半部,要么用六畫的“江”這個(gè)同音字來代替,不過這樣寫是“不合法的”。同樣的,“舞”字有十四畫,也讓許多舞廳經(jīng)常用只有四畫的同音字“午”來代替。另一個(gè)十二畫的常用漢字“街”,由于它的出現(xiàn)頻率太高,所以會(huì)讓很多信筆寫來的人丟掉中間的六畫。“疆”“舞”“街”這三個(gè)都沒有官方認(rèn)可的簡化形式,但是由于漢字的平均筆畫是十二畫,我們完全可以理解一直存在著創(chuàng)造出這幾個(gè)簡化字的強(qiáng)烈的沖動(dòng)。運(yùn)用最廣泛的語音文字體系(如羅馬字和日本的假名)是從更復(fù)雜的形式中演變而來的,所以漢字筆畫簡化的自然趨勢(shì)可能將其導(dǎo)向一種語音文字。然而在政府和知識(shí)分子的強(qiáng)有力抵制下,這種趨勢(shì)被阻擋了。
現(xiàn)代漢語中出現(xiàn)頻率最高的語素“de”的對(duì)應(yīng)漢字“的”值得我們特別關(guān)注。“的”表示所有格、形容詞結(jié)尾、關(guān)系從句、介詞短語和動(dòng)名詞等。這個(gè)漢字在文本中每間隔二十個(gè)字就會(huì)出現(xiàn)一次(!),一共有八畫,即使其草體也讓有些人覺得麻煩,所以——在私人場(chǎng)合——用字母“d”來代替(d是“的”拼音首字母)。“的”字的通用簡化形式還沒有發(fā)明出來,官方接受的簡化形式更需假以時(shí)日。更具諷刺意義的是,用來書寫無處不在的語素de的漢字“的”,其第二聲至今還具有其原初意義“光亮,目標(biāo)” (一千多年以前的發(fā)音為tiek ,兩千多年前的發(fā)音大概為*tiawk)。
許多人現(xiàn)在經(jīng)常私下使用字母d來代替“de”這個(gè)頻率非常高的語素。實(shí)際上,de是個(gè)多義語素,至少是三個(gè)同音語素合而為一,而在書面中則用三個(gè)不同漢字來表示。有意思的是,用來表示這三個(gè)高頻率語素的三個(gè)漢字原先的字義都不包括語素所指代的意思,而是被借用了:一、上文已提到,標(biāo)記所有格和關(guān)系從句的de,用實(shí)際上意思是“目標(biāo)”的“的”字表示;二、標(biāo)記形容詞補(bǔ)語的de,用原初字義為“得到”的“得”字表示;三、標(biāo)記動(dòng)詞補(bǔ)語的de,用“地”字表示,其原初字義為“大地”,原初發(fā)音為di。現(xiàn)代漢語中這三個(gè)出現(xiàn)頻率最高的語素(在通常的文本中平均占全部漢字6.5%)的對(duì)應(yīng)漢字居然是原初具有不同語義、語義上被漂白的漢字,這一事實(shí)凸顯了本章前幾節(jié)中提到的漢字體系和白話之間的鴻溝。于是,有些人用一劃而就的d(即寫這個(gè)字母的時(shí)候,筆可以不離開紙面),來代替分別為八畫、十畫和六畫的“的”“地”“得”。
漢字極其錯(cuò)綜復(fù)雜和難以把握的特性對(duì)漢字讀寫和中國文學(xué)都產(chǎn)生了重大影響。漢字的一些社會(huì)意蘊(yùn)、語言意蘊(yùn)和審美意蘊(yùn),在本章以下的討論以及全書各章中將得到清晰呈現(xiàn)。