如果按筆畫順序拆字,就必須突破囗這個沿用了千年的傳統部首框框,談漢字字根的篩選_風聞
夏国民-24分钟前
談漢字字根的篩選
——拼形文字(第16篇)
夏國民
(本文始發於微信公眾號“中文分説”)
引入字根概念用於拆字,目的就是為了儘可能地快速分解,並以此促進漢字易學。在解決按筆畫拆字效率慢的同時,需要反覆權衡學習的難度和應用的方便。字根是漢字零件和部件的統稱,自第8篇始,多篇都曾零碎地涉及了漢字字根的篩選,這裏是專門論述。
為了追求拆字、檢字和打字的高效率,在字根篩選的過程中,控制字根數量和儘量減少重碼,需要採用大量的“拆字比較實驗”來確定,舍此別無它法。減少重碼不僅僅是針對單字,字母編碼中的常用詞往往是重點關照的對象,後者需要數以萬計的詞條編碼數據來予以支持,比如對“不、大”的處理。篩選的基本原則是以形為主,兼顧字理,不是以傳統字理為主。
漢字的零件是單筆畫,漢字的部件是由兩個以上筆畫構成的固定形態。所謂的字根篩選,實際上主要是部件的優化。面對常用的3000多個漢字,即使從來沒有學過五筆的人,只要理解“現代漢字主要是由一些筆畫簡單的漢字和常見的偏旁構成的”這一基本道理,對大多數漢字的字根都能分得出來。
如果在小學漢字偏旁概念教學階段,同時教學字根概念,不僅不會產生矛盾,還能相互強化,促進識字教學。
上世紀八九十年代王碼五筆風行多年,最主要的原因就是基於五大筆畫分類,將字根映射到鍵盤區域,抓住和展現了利用字根拆字和打字效率高的優點,其次則是那時的拼音輸入法效率實在太低,在一定程度上襯托了王碼優秀。
進入二十一世紀以後,音碼輸入法快速迭代,迅速成為主流,而形碼輸入法則沒能跟上智能時代步伐,逐漸式微。但是,王碼五筆輸入效率高的優點,一直到現在都否認不了。
音碼在智能方面暫時領先,但在根本上沒有唯一性,因為基本面上的編碼位置比較少,先天不足,輸入主要靠按音打了再找,實際上是“選字法”。就智能習慣性輸入短期記憶而言,音碼與形碼比,並沒有優勢可言,形碼是開發滯後了。
下面是五筆與同為形碼的鄭碼和蒼頡碼的簡單對比。
鄭碼的字根比較多,有360個,而且多數是雙碼字根,還有一些是三碼字根,記憶量太大。
蒼頡碼字根比較少,只有108個,但編碼時卻先要把漢字拆分成“字首”和“字身”兩部分,再分別編碼,比較煩瑣。
五筆字根表中是197個,按通用鍵盤分區排列,字根與編碼直接對應,能給人直接了當之感。
有人説王碼五筆學習門檻高,客觀上阻止了很多學習者。也有人説是音碼植根於漢語教學之初,主要得益於課堂拼音教學之便,而學五筆需要在課堂外花時間。這兩種説法都比較客觀,值得反思,都有改進的空間。
當下,我們仍須直接面對這樣一個問題:無論形碼還是音碼,到目前為止都還沒有徹底解決語文教學中的根本問題,即識字、寫字、檢字、打字“四位一體統一模式”仍懸而未決。實際上,在漢語教學中,音和形猶如兩條腿走路,缺一不可。“識、寫、檢、打”四位一體的統一,是上世紀末有關部門制定的語文教學計算機應用總目標。幾十年來,各式各樣的探索之路都沒有走通,主要原因在於思想障礙,為什麼不能在前人已經築好的基礎上繼續創新呢?
所有形碼方案都必須拆字。按筆畫順序拆字,應該是唯一正確的方法,否則難以服眾。因為筆畫順序是學習漢字的基礎知識之一,舍此別無它途。以往大陸和台灣都有“根序”一説,這就意味着還各自另有一套,很多字的“根序”必須重新學習和硬記,免不了有自説自話之嫌。因此,筆者提出“順序按筆畫”作為拆字第一規則,就補上了王碼五筆的一個主要短板——被人詬病的“不規範”問題。
例如“武”字,需要嚴格按筆畫順序拆成“二、止、折、丶”,而不是以往的“一、弋、止”。
關鍵在於,如果嚴格按筆畫順序拆字,就必須突破“囗”這個沿用了近兩千年的傳統“部首”框框,即前兩筆跟最後一筆分離。但對把持者來説,這是不可接受的。
另外,為了嚴格按筆畫順序拆字,還需要增加“可、必”這樣能夠避免引起筆畫混亂的字根字。而裁減王碼五筆“共的前四筆”即“草頭加一橫”這個字根,則是兼顧字理、用以避免“荊、萊、蕪、芙、茉”這些字在拆分時“前拉後扯”的必要之舉。
總而言之,嚴格按筆畫順序拆字,是新方案有別於王碼五筆拆字的主要創新點之一。當然,字根數碼檢字法本身就是創新。
就編碼而言,字根數碼檢字法是字母編碼輸入法的簡化版,但所選字根都是統一的,拆字方法自然也一樣。
為了進一步提高拆字效率,與86版五筆相比,新方案一共增加了48個筆畫比較多的字根,特別是增加了“不、兀、束、醫、可、毛、乍、丘、隹、午、州、必、爿、母”這十幾個字根字;不過,同時也減少了“囗、已”等26個字根;此外,還移動了22個字根,挪動最多的是點區向豎區移動的近10個以豎筆起頭的字根。因而字根變動數量加在一起將近100個,變化比較大。

按確定的數據統計,字根實際上是添加了22個。另外,按25鍵計算,字根總數275,平均每鍵正好是11個。其中的每一個字根,都通過了嚴格的篩選,至於是否都經得起時間考驗,則另當別論。