四川省科學(xué)技術(shù)協(xié)會(huì ) 錢(qián)玉趾
文字記錄語(yǔ)言,是傳輸信息的重要工具。世界已經(jīng)跨入電腦為特征的信息時(shí)代,語(yǔ)文應該跟上這個(gè)時(shí)代,也就是說(shuō),語(yǔ)文的現代化,必須適應高度信息化的要求。文字與書(shū)寫(xiě)工具之間有一定的聯(lián)系和相互制約的關(guān)系,古代的蘇美爾人用蘆葦或骨棒在泥板上"壓寫(xiě)"楔形文字,而印歐文字、漢字等是用筆"劃寫(xiě)"出來(lái)的。在電腦時(shí)代,文字主要通過(guò)鍵盤(pán)"觸寫(xiě)"出來(lái)。鍵盤(pán)上有26個(gè)字母鍵,10個(gè)數字鍵和其他符號鍵。人們敲擊這些鍵符,就能書(shū)寫(xiě)、傳輸和存貯文字符號。英文是由26個(gè)拉丁字母按線(xiàn)型排列書(shū)寫(xiě)的文字,用電腦鍵盤(pán)"觸寫(xiě)",可以說(shuō)是珠聯(lián)璧合,得心應手。我國的漢字,是由筆畫(huà)按平面組合的一種二維圖形。其特點(diǎn)是漢字的平均筆畫(huà)多、結構復雜,總字數多,而且一字一音,全靠死記硬背,不能直接用電腦進(jìn)行信息處理,必須先將漢字進(jìn)行編碼才行,F有的漢字編碼(包括形碼、音碼、音形碼),可以將漢字輸入電腦,在一定的范圍傳輸、存貯和輸出,在排序和情報檢索方面還無(wú)能為力。所以,實(shí)際上漢字編碼只使電腦變?yōu)橐环N漢字打字機,并且是效率不太高的打字機。
文字信息處理技術(shù)可分為三種方式:一、鍵盤(pán)處理;二、字符識別;三、語(yǔ)音識別。漢字編碼只能用于鍵盤(pán)處理的某些部分(不是全部),不能用于更高級的字符識別和語(yǔ)音識別方面。所以,漢字編碼只是使文字信息處理技術(shù)處于低級階段。在這種情況下,有人設計了一種漢字編碼,可應用于電腦打字,就宣布說(shuō)使古老的漢字"趕上了電腦時(shí)代","在信息時(shí)代重光了",這相當于在社會(huì )主義初級階段宣布進(jìn)入了共產(chǎn)主義一樣幼稚可笑。
在字符識別方面,光學(xué)字符識別機對于拉丁字母和阿拉伯數字的印刷體,采用16×16或18×20點(diǎn)陣就行,而方塊漢字的印刷體,用60×60點(diǎn)陣還不夠。識別英文只需識別26個(gè)字母。在日本,識別50個(gè)假名和2000個(gè)漢字,識別字符的數量約是英文字符的80倍,加之漢字結構的復雜性,日本專(zhuān)家估計:日本漢字識別的難度是拉丁字母的500倍。我國專(zhuān)家估計,識別中國一、二級漢字的難度將是拉丁字母的2000倍[1].
漢字不是拼音文字,在語(yǔ)音識別方面更為困難,現有的編碼也不能用于語(yǔ)音識別。在機器翻譯方面,我國1957年開(kāi)始研究,至今近40年,成績(jì)不小。但是翻譯質(zhì)量還不十分令人滿(mǎn)意,一些稍長(cháng)的句子或結構復雜的句子,譯文質(zhì)量就較差,有時(shí)簡(jiǎn)直不能卒讀[2]。曾有人指出:"采用方塊漢字中文-外文翻譯系統,即使勉強實(shí)現,也將是世界上造價(jià)最高、效率最低的機器翻譯系統。[3]"要解決機器翻譯的質(zhì)量問(wèn)題,提高機器的智能化是一個(gè)方面,更重要的是要有一種精密而單義的漢語(yǔ)拼音文字所表達的形式語(yǔ)文,可惜現在沒(méi)有。
世界進(jìn)入了信息時(shí)代,真正有用的信息將是具有跨文化傳通功能的信息,并且是高度精密、高度可靠的信息。作為這種信息載體的語(yǔ)言文字,也必須具有跨文化傳通的功能,高度精密、高度可靠,能滿(mǎn)足信息處理技術(shù)三種方式的要求,能滿(mǎn)足機器翻譯的高質(zhì)量的要求。
符合高度信息化要求的漢語(yǔ)拼音文字,具體地說(shuō),我們認為,應該滿(mǎn)足以下條件:
一、采用26個(gè)國際通用的拉丁字母,從左至右,線(xiàn)型排列;
二、漢語(yǔ)是有聲調的語(yǔ)文,其音節應該使用字母妥善地標明聲調;
三、妥善分化同音詞,拼音詞與方塊漢字詞應基本上一一對應,沒(méi)有同形詞;
四、為了便于識讀和理解(包括人和機器的識讀理解),詞匯應有標明詞性詞義之類(lèi)的詞綴,并按詞分寫(xiě)。
五、有科學(xué)合理的正詞法及語(yǔ)法規則。
當然,上述條件不是一成不變的,在其些場(chǎng)合為了簡(jiǎn)便快捷,音節可有簡(jiǎn)化形式,詞語(yǔ)可有縮略式等等。
漢語(yǔ)拼音文字既然是一種拼音形式的文字,就應該具備拼音文字必須具備的特點(diǎn)。我們不妨分析一下世界上主要語(yǔ)種的文字。
印歐語(yǔ)系的絕大多數文字都具有表示詞性的詞尾或冠詞。西班牙語(yǔ)的名詞的性可根據詞尾辨認,以?結尾的名詞,一般都是陽(yáng)性,以?結尾的名詞,一般都是陰性,冠詞放在名詞之前,表示名詞的性、數等等。形容詞的性和它所修飾的名詞的性、數相一致,修飾陽(yáng)性名詞時(shí)以?結尾,修飾陰性名詞時(shí)以?結尾。動(dòng)詞的原形動(dòng)詞都以-ar、-er、-ir結尾(分別稱(chēng)為第一、第二、第三變位動(dòng)詞)。
德語(yǔ)的名詞是用冠詞來(lái)表示的,而且,名詞的第一個(gè)字母必須大寫(xiě),這些名詞的特征更強,如陽(yáng)性名詞:der Mann(男人、夫);陰性名詞:die Frau(婦女)。德語(yǔ)的形容詞與西班牙語(yǔ)類(lèi)似,也必須與名詞的性、數和格一致。德語(yǔ)的動(dòng)詞的不定式,是由動(dòng)詞的詞根加后綴-en或n構成。
世界語(yǔ)的單數名詞以-o結尾,陰性名詞以-ino結尾;形容詞以-a結尾;動(dòng)詞不定式的詞尾都是-i,其現在式、過(guò)去式等等都有明確規定。
英語(yǔ)的名詞也有自己的特點(diǎn),約有50個(gè)習用詞(稱(chēng)為名詞限定詞),主要作用是標明其后的詞是名詞。表示人的名詞有相應的后綴,還有專(zhuān)門(mén)表示女性名詞的后綴。英語(yǔ)的形容詞也有專(zhuān)門(mén)的構詞后綴。英語(yǔ)中的名詞、動(dòng)詞、形容詞相互轉類(lèi)都有一定的規則。
日本在古代借用中國的漢字作為書(shū)寫(xiě)文字,初期全用漢字,在平安時(shí)代產(chǎn)生了假名,F代日文是漢字假名混用的文字。日本借用漢字并沒(méi)有照搬,而讓有些漢字詞長(cháng)了尾巴。日語(yǔ)的動(dòng)詞以う段音結尾,如:會(huì )ぅ(會(huì )見(jiàn))、行く(去)、踴る (跳)、打つ(打)、踏む(踩);日語(yǔ)的形容詞都以假名字母い結尾,如:赤い(紅的)、甘い(甜的)、高い(高的)、美しい(美的)。此外,還有一些助詞,在句子中起到確定主語(yǔ)、賓語(yǔ)、謂語(yǔ)等等的語(yǔ)法作用。
漢語(yǔ)拼音文字加上詞性詞義的詞綴,主要的作用是使文字變得精密,能準確表達,便于識讀和機器翻譯,同時(shí)還可以與區分同音詞結合起來(lái)考慮?芍^一舉兩得。例如:"父女兩個(gè)談枇杷"、"婦女兩個(gè)彈琵琶"兩句,其中詞性相同的"父女"與"婦女","談"與"彈","枇杷"與"琵琶"必須有不同的音節拼寫(xiě)形式,才不致弄混。有人認為,詞性不同的同音詞不全混淆,其實(shí)不然。例如:"(撞見(jiàn)/壯。┑氖莻(gè)大傻瓜",就容易混淆。如用動(dòng)詞性詞尾?、形容詞詞尾?加以區分,即:撞見(jiàn)zhuàngjiànd、壯健zhuàngjiànx(標調字母暫不討論),就比較理想了。
三十年代制訂推行拉丁化新文字的年代,中國還是半封建半殖民地的國家,十分貧窮落后,為了掃除眾多的文盲,文字的簡(jiǎn)易是歷史的需要。趙元任的《通字方案》也是在中國比較貧窮的歷史背景下產(chǎn)生的,"兒童不識"簡(jiǎn)化為"而同不式",已經(jīng)不適應今天的需要?茖W(xué)技術(shù)飛速發(fā)展的今天,每秒運算4000億次的超級計算機已經(jīng)造成,宇宙飛船可以在太空對接。這一切都與高速度、高精密、高可靠分不開(kāi)。我國未來(lái)的文字,必須能滿(mǎn)足超級計算機信息處理的要求。有些人喜歡沉緬于"一東二冬"的音韻和"篆隸行草"的書(shū)法,故步自封。從秦代兵馬俑深坑里挖出的車(chē)輛,就算轉動(dòng)靈活,再加注高級潤滑油,在高速公路上只能起堵車(chē)作用。在信息高速公路上,古老的漢字也只能起堵車(chē)作用。為了國家的現代化,必須實(shí)現語(yǔ)文現代化。而語(yǔ)文現代化,必須著(zhù)眼于高度信息化,設計出相應的漢語(yǔ)拼音文字。
注釋?zhuān)?nbsp;
[1] 陳明遠:《語(yǔ)言文字的信息處理》,知識出版社1985年版
[2] 馮志偉:《邁向實(shí)用化和商品化的機器翻譯研究》,《語(yǔ)文建設》1994年8月
[3] Chen Guan:《機器翻譯和漢語(yǔ)拼音正詞法》、《語(yǔ)文現代化》1980.3
[語(yǔ)文現代化應著(zhù)眼于高度信息化]相關(guān)文章:
8.小班教案應彩云