中文和英文本來不同,它們的結構如何對應,
從不同的角度看,就有不同結果,因此一直沒有定論。
語言學中,英文的結構概略如下:
alphabet → root → word → phrase → sentence
(a-z) (pre-) (dog) (in love)
文字學中,中文結構概略如下:
(筆劃) → 文 → 字 → 詞 → 詞組 → 句
為什麼英文用語言學看,而中文用文字學看?
因為文化不同。
洋人本來沒有文字學,只有written language(被寫的語言),
換言之,他們只有記錄語音的符號系統,只有alphabet和word,
直到他們和中國交流,才知道世界上有這樣大相逕庭的體系。
而中國就有語言、文字之分,
中國沒有字母的概念,
只有獨體為文,合體為字,word是很不一樣的東西,
有人認為是「字」,有人認為是「詞」,
為了和中文稍作區別,於是有稱單字,有稱單詞。
中文的文和字母很像,而字似乎可以和字母的組合,即word相對應;
再加上「詞」是指一種語言常見的切割單位,和word很像,所以是詞。
但從文字、思維的角度看,中文的「文」帶有基本概念,比較像root;
而「字」是常用的最小概念單位,和word很像;
英文的word間有空格,恰似中文字和字之間的分界,所以是字。
那英文的字母對應什麼?某些人認為像中文的筆劃。
實際上辭和詞也不同,
「辭」是文字的概念,象石塊上寫文字的樣字,是常用的一連串文字;
「詞」則是語言的概念,是常見的切割單位。
這些語言學的結構都只是概略的概念,一直無法被精確定義,
word很難定義,
單從英語格式來看word,
早先有人認為是「最小的意義單位」,顯然未必,因為英語很多詞由詞根組成。
於是修正為「可單獨使用的最小意義單位」,似乎好一點,
但也有模糊地帶,有wheelchair,那麼chair是詞或詞根?
有人從書寫格式立論,認為是「由空格隔開的單位」,
但English-to-Chinese當作word,cell phone當作二個word,似乎有些奇怪。
如果加上其他語言,那就更複雜了,
世界上的語言大略可分為四大類,
「分析語」如中文,缺少變化,以虛詞和詞序表達不同的文法意義。
中文的word很難定義,因為中文沒有空格,但通常把word當作詞,字則另稱character。
「膠著語」如日文,缺少變化,但常以詞後黏附的虛詞,表達不同文法意義。
日文同樣沒有空格,所以word也不很清楚。
「屈折語」如英文,詞有多種首尾變化,且通常有特殊的文法詞,能構成複雜的複句。
英文常能見到一句話5到6行,其間的文法修飾交錯複雜;
古代更典型的屈折語如希臘語,則文法變化更多,複句也更複雜,
比方但丁的《神曲》,一段即是一句,可長達15行,
其間大量子句的修飾關係教人嘆為觀止,
還帶有「三韻體」格律,漢譯難如登天。
「多式綜合語」的一個word,若用與英語類似的定義,即包含大量複雜文法的詞根,
有時一個句子只有一個word,
舉個維基百科的例子,
「Aliikusersuillammassuaanerartassagaluarpaalli」
aliiku -sersu -i -llammas -sua -a -nerar -ta -ssa
娛樂 -提供 -半及物動詞 -他精於 -繫詞 -說 -重覆 -將來式 -肯定的,但是
-galuar -paal -li
-第三人稱眾數主語 -第三人稱單數賓語 -但
「不過,他們會說他是個偉大的娛樂圈人,但……」
世界語言千差萬別,難怪連個word都很難定清楚。
從書寫系統來看,二大分類是拼音文字和漢字。
光是拼音文字,就有4大類「字母」。
「音素文字」是像英文這樣,字母代表大部分語音單位。
(少數例外是像-sion、-sure這種複合單位)
有人把韓文歸為此類,但韓文把每個音節用方塊字的形式表現,較為特殊。
「輔音音素文字」(Abjad)如阿拉伯文,通常只寫子音,不寫母音。
「母音附標文字」(Abugida)如天城文(印度文)、梵文,主音通常帶一個預設母音,
但可透過前後上下的附加標記修改母音。是一種另類的「字母」。
「音節文字」(Syllabary)如日文,一個「字母」表示一個音節。
漢字是什麼文字?外國稱作logogram。
而中國人稱呼就有些困擾,
「文字」本來就只用於稱呼漢字,其他的拼音文字充其量只能視做「書寫系統」。
但由於中西交流,文字的涵義改變了,
近來漢字有稱表意文字、象形文字等。後來有些人認為不夠全面,改稱意音文字。
一種語言對應一種文字,漢字卻對應多種語言,
普通話和閩語的差異,實際上比德語和英語差異更大。
多數語言一個義由多個音表示,一組音通常一個義;漢字卻一音多字,一字多義。
文言文和白話文又顯著不同。
孔老夫子講的究竟是不是「學而時習之不亦說乎」?若不是那是什麼?
世界上語言間的交流多半是音譯,唯漢字文化圈以意譯為主。
和世界上大多數文字相比,漢字異常獨特。
漢語的單位似乎是詞,但漢文的單位比較像是字。
覺得拼音文字應該叫標音符號才對
回覆刪除古埃及、古印度和蘇美爾也是用意音文字
回覆刪除有理論說源生文明用意音文字,次生文明用拼音