中文與英文的字詞關係

中文和英文本來不同,它們的結構如何對應,

從不同的角度看,就有不同結果,因此一直沒有定論。


語言學中,英文的結構概略如下:

alphabet → root → word → phrase → sentence
(a-z)      (pre-)   (dog)  (in love)


文字學中,中文結構概略如下:

(筆劃) → 文 → 字 → 詞 → 詞組 → 句


為什麼英文用語言學看,而中文用文字學看?

因為文化不同。

洋人本來沒有文字學,只有written language(被寫的語言),

換言之,他們只有記錄語音的符號系統,只有alphabet和word,

直到他們和中國交流,才知道世界上有這樣大相逕庭的體系。


而中國就有語言、文字之分,

中國沒有字母的概念,

只有獨體為文,合體為字,word是很不一樣的東西,

有人認為是「字」,有人認為是「詞」,

為了和中文稍作區別,於是有稱單字,有稱單詞。


中文的文和字母很像,而字似乎可以和字母的組合,即word相對應;

再加上「詞」是指一種語言常見的切割單位,和word很像,所以是詞。


但從文字、思維的角度看,中文的「文」帶有基本概念,比較像root;

而「字」是常用的最小概念單位,和word很像;

英文的word間有空格,恰似中文字和字之間的分界,所以是字。

那英文的字母對應什麼?某些人認為像中文的筆劃。


實際上辭和詞也不同,

「辭」是文字的概念,象石塊上寫文字的樣字,是常用的一連串文字;

「詞」則是語言的概念,是常見的切割單位。



這些語言學的結構都只是概略的概念,一直無法被精確定義,

word很難定義,

單從英語格式來看word,

早先有人認為是「最小的意義單位」,顯然未必,因為英語很多詞由詞根組成。

於是修正為「可單獨使用的最小意義單位」,似乎好一點,

但也有模糊地帶,有wheelchair,那麼chair是詞或詞根?

有人從書寫格式立論,認為是「由空格隔開的單位」,

但English-to-Chinese當作word,cell phone當作二個word,似乎有些奇怪。


如果加上其他語言,那就更複雜了,

世界上的語言大略可分為四大類,

「分析語」如中文,缺少變化,以虛詞和詞序表達不同的文法意義。

中文的word很難定義,因為中文沒有空格,但通常把word當作詞,字則另稱character。


「膠著語」如日文,缺少變化,但常以詞後黏附的虛詞,表達不同文法意義。

日文同樣沒有空格,所以word也不很清楚。


「屈折語」如英文,詞有多種首尾變化,且通常有特殊的文法詞,能構成複雜的複句。

英文常能見到一句話5到6行,其間的文法修飾交錯複雜;

古代更典型的屈折語如希臘語,則文法變化更多,複句也更複雜,

比方但丁的《神曲》,一段即是一句,可長達15行,

其間大量子句的修飾關係教人嘆為觀止,

還帶有「三韻體」格律,漢譯難如登天。


「多式綜合語」的一個word,若用與英語類似的定義,即包含大量複雜文法的詞根,

有時一個句子只有一個word,

舉個維基百科的例子,

「Aliikusersuillammassuaanerartassagaluarpaalli」

aliiku -sersu -i          -llammas -sua  -a  -nerar -ta     -ssa
娛樂   -提供  -半及物動詞 -他精於  -繫詞 -說 -重覆  -將來式 -肯定的,但是

-galuar           -paal             -li
-第三人稱眾數主語 -第三人稱單數賓語 -但

「不過,他們會說他是個偉大的娛樂圈人,但……」


世界語言千差萬別,難怪連個word都很難定清楚。



從書寫系統來看,二大分類是拼音文字和漢字。

光是拼音文字,就有4大類「字母」。

「音素文字」是像英文這樣,字母代表大部分語音單位。

(少數例外是像-sion、-sure這種複合單位)

有人把韓文歸為此類,但韓文把每個音節用方塊字的形式表現,較為特殊。

「輔音音素文字」(Abjad)如阿拉伯文,通常只寫子音,不寫母音。

「母音附標文字」(Abugida)如天城文(印度文)、梵文,主音通常帶一個預設母音,

但可透過前後上下的附加標記修改母音。是一種另類的「字母」。

「音節文字」(Syllabary)如日文,一個「字母」表示一個音節。


漢字是什麼文字?外國稱作logogram。

而中國人稱呼就有些困擾,

「文字」本來就只用於稱呼漢字,其他的拼音文字充其量只能視做「書寫系統」。

但由於中西交流,文字的涵義改變了,

近來漢字有稱表意文字、象形文字等。後來有些人認為不夠全面,改稱意音文字。


一種語言對應一種文字,漢字卻對應多種語言,

普通話和閩語的差異,實際上比德語和英語差異更大。


多數語言一個義由多個音表示,一組音通常一個義;漢字卻一音多字,一字多義。


文言文和白話文又顯著不同。

孔老夫子講的究竟是不是「學而時習之不亦說乎」?若不是那是什麼?


世界上語言間的交流多半是音譯,唯漢字文化圈以意譯為主。


和世界上大多數文字相比,漢字異常獨特。

漢語的單位似乎是詞,但漢文的單位比較像是字。

留言

  1. 覺得拼音文字應該叫標音符號才對

    回覆刪除
  2. 古埃及、古印度和蘇美爾也是用意音文字
    有理論說源生文明用意音文字,次生文明用拼音

    回覆刪除

張貼留言

1.本格歡迎任何留言,只有廣告和垃圾留言會刪。
2.希望您盡量留下代稱,以方便大家討論、回覆。
3.如果您打算長篇大論,建議在您自己的部落格貼文,然後留下連結和摘要。

這個網誌中的熱門文章

Windows 批次檔令人崩潰的特殊字元處理

中文與英文的比較

為什麼 Mercurial 沒有比 Git 更好