破解漢字“病於不能分”之謎,將漢字拆分為字根_風聞
夏国民-26分钟前
將漢字拆分為字根
——拼形文字(第10篇)
夏國民
學者李華在公開發表的《漢字部件研究的回顧與展望》一文中指出:“清人王筠《文字蒙求》自序中説:‘人之不識字也,病於不能分,苟能分一字為數字,則點畫必不可以增減,且易記而難忘矣’,足見古人早已認識到漢字拆分的重要意義。”——題記
按筆畫順序將漢字拆分為筆畫,方法簡單,最大優點是有規則可守,近乎有規律可循。但此法的最大缺點是拆分太細,效率很低,不便於實際應用。引入字根概念,將漢字拆分為字根,能夠保持上述優點,克服上述缺點。
從筆畫角度看,漢字字形是分為筆畫和整字兩個層次。
從字根角度看,漢字字形分為零件、部件和整字三個層次。這裏所謂的零件和部件,是借用機械行業的零部件名詞,用於文字領域,是取其相輔相成之意,僅此而已。假設三十三個不同的現代漢字筆畫是零件,大概而言,由多個筆畫構成的形態則是部件。
通俗地説,漢字的零件和部件統稱為字根。漢字的零件就是單筆畫,漢字的部件則是由兩個以上筆畫構成的固定形態。舉兩個最簡單的例子:“一、丨”是零件,“十”就是部件。至於大多數漢字中的部件如何界定,則要先從確定字根入手。
簡單來説,字根是由筆畫構成的構字單元。嚴格來講,只有完全符合特定拆字規則(字根訣)的構字單元才是各字的字根。
將漢字拆分為字根是漢字拆分的第二種方法。細論字根之前,先要明確如下幾點。
第一,對於“一、丨、丿、丶、乙”這五個單筆畫漢字來説,它們均具有“筆畫、字根、漢字”三重身份。
第二,把筆畫相對簡單且能構成其它漢字的獨體字稱為字根字。除上述五個單筆畫字根字外,現代漢字裏還有逾百個多筆畫字根字。比如“夠”字裏的“口、夕”是字根字,但“句”和“多”就不是字根字。至於具體的字根如何確定,稍後説明。
第三,一般來説,人們認定漢字部件的主觀性較強,不應該泛泛地就部件論部件,否則很容易陷入見仁見智的爭論之中。實質上,務必確定的應該是構字部件。
下面來詳細論述字根。
字根大部分是由多筆畫構成的構字單元,理應保持筆畫構字的三個優點。
其一,筆畫交叉構形是漢字有別於其他字母文字最顯著的特點,具有二維變化和承載更大信息量的優點,字根自然應該保持重疊構成漢字的優勢。
其次,前面提到的字根字,其本身就是構成普通漢字的部件或零件,是特殊的基礎字,為了加強離散性,在實際應用時仍應將其拆成筆畫進行特殊處理。
其三,現代漢字的筆畫順序規則,是形成字根的重要隱形資源,應該充分利用。
漢字字根不是自古就有的概念,即使固定形態的呈現形式也只能追溯到宋體定型初期。字根是基於大量現代漢字拆分實驗的數據統計中優化提煉出來的,其中大部分的形態與漢字偏旁相同。其歷史沿革,這裏不作贅述。
以下重點討論字根中的部件。
33個不同的筆畫都是零件,至少有兩個零件構成的“塊”才可稱其為部件。當然,字中的零件不能切斷或重複使用,這是常識。
一般來説,部件比整個字的筆畫少,比零件的筆畫多,很多筆畫較少的獨體漢字,自然而然能夠入選構字部件。比如:日月水火,山石田土,人手工幹士,口耳目夕了,二三四五六,七八九十丁,廠卜兒幾匕,刀力又乃之,工寸大小廣,子女馬上弓,門己巳屍幺。
上列這五十多個常用字,其中兩筆和三筆的就有四十多個。不過,不是所有的兩筆、三筆常用字都能入選部件。
具有構字功能是入選構字部件的必要條件,因而很多常見的偏旁都能入選,哪怕像“雨”這樣筆畫多達八個的都需要入選其中。入選構字部件的最低要求,是至少可以構成另外一個字。比如,已經的已就沒有這個資格。
引入構字部件進行漢字分拆,是為了克服“按筆畫拆分漢字編碼過於冗長”這個效率低的缺點,介於筆畫與整字之間的多筆畫“塊”很多都有必要成為部件。例如,如果將八筆的“雨”做進一步拆分,就會弄成一筆或兩筆的一大串“塊”,將有五個之多。由此可見,如果單純講拆字的效率,部件筆畫宜多。倘若按照這個道理操作,最好是把各字都拆成兩、三“塊”。如果把這裏的“塊”看成是透明的,自然就能重疊拼漢字。比如將“口”和“丨”拼成“中”。實際上,《説文解字》中,本來早就註明了:“中,從口從丨”。這也就是零件和部件應該被允許重疊拼漢字的理據。
對構字部件的鑑別和認定,從總數上來説,需要綜合考慮多種因素,主要在於方便學習與應用的效率權衡。部件數量過多,學習時記憶負擔太重,不利於熟悉。數量太少,則容易形成大量重碼,影響應用效率。根據數萬級的拆字編碼對比權衡實驗,構字部件總數以二百幾十個為宜,接近目前普遍使用的字典詞典的部首總數。當然,這裏存在一個對其中少數部件認定的社會共識問題,但無論如何,從總體上來説,部件應用效率高是客觀存在的。
倘若構字部件總數定了,加上前面論述過的五個有代表性的單筆畫字根,全部字根總數也就定了。
從實際應用出發,就具體的漢字論字根,從國家規定的現行一、二、三級漢字中,可以總結出一個嚴密的將漢字拆分為字根的規則:順序按筆畫,簡單讓複雜,數量要最少,儘量不交叉。
以上規則具有邏輯性,按此操作能夠層層遞進鎖定各個漢字的字根。通俗地説,如果嚴格按照這個字根規則拆分普通漢字,針對各個漢字所拆得的字根,答案都是唯一的。如此操作,各個漢字的零件和部件都能一目瞭然:單筆畫字根是零件,多筆畫字根是部件。
下圖是漢字拆分示例。

再以本文標題為例,“將漢字拆分為字根”這八個字的字根數,依次為“3、2、2、3、2、3、2、3”,總數是20個,其中零件只有3個(碰巧是“拆、為”字中的三個“丶”),部件是17個。即使是從來沒有學習過這種拆分方法的人,稍為觀察一下,也能大致分得出來。按字根分拆漢字的快捷,由此可見一斑。
按字根分拆漢字,關鍵是嚴格執行國家頒佈的統一筆順規範,突破了漢字自有字典以來一直沿用的以方框(囗)為代表的部首檢字法人為框框的限制,將“國”字的前兩筆與最後一筆,按寫字順序拆分成“冂、一”兩個字根處理,沒有墨守類似方框不能拆的陳規陋習,避免了非筆畫順序之間前筆與後筆隔位拉扯的操作。由於有邏輯性,沒有歧義,因此奠定了高效拆分漢字的基礎。