![[發布]自然全分:檢字法,全字集,高離散,低學習成本](https://pic4.zhimg.com/v2-15a96674bd5f0afe344b7eca37710593_1440w.jpg?consumer=ZHI_MENG)
[發布]自然全分:檢字法,全字集,高離散,低學習成本
〇、引言
檢字法,全字集,高離散,低學習成本。
覆蓋漢字基礎區~擴J全部 10,1984 字,以及所有部首、筆畫、結構字符 384 個。共計包含 55,0881 種拆法。
示例:並并幷併竝𠀤。

如上圖,這一組異體字直觀地展示了本方案的特點:
- 不強調低重碼。
- 強調首選率。
- 強調多種拆法覆蓋。
- 強調直觀易用。
適用場景
- 快速輸入生僻單字⸺不熟悉音義,但清楚字形與部件音義,常規方式難以輸入。面向古文爲主。
- 快速輸入異體單字⸺知曉本字、音義、字形,但在主力輸入方案中難以輸入,甚至無法輸入。面向古文爲主。
- 快速輸入難檢單字⸺音形義俱熟,但在主力輸入方案中存在大量重碼,檢字花費時間較多。解決大量選重。
- 本方案不適合打詞、句,詳見下文。
存在形態
- 作爲反查單字檢索方案存在(檢字)。適合混合輸入單字、詞句場景,大量詞句、少量單字。需額外一鍵啓動(典型配置使用「`」鍵),但最爲靈活。同類形態舉例:魔然方案掛載反查方式⸺自然兩分(源自葉典網「字海兩分」)、虎碼、倉頡、筆畫、注音符號。
- 作爲獨立單字輸入方案存在(打單)。適合補校生僻、異體、難檢字場景,確定只打單。此時專注於此方案下,無需啓動切換。通過少量配置,將此方案掛載爲獨立方案。
- 在 rime 輸入平臺下,以上兩種形態可以並存且互不干擾。
本方案志不在取代常規輸入方案,而在互補共存。
🔗下載鏈接
方案分類
以常規分類而言,輸入方案有三類:音碼、形碼、音形碼。
以用途而言,輸入方案有兩類:打字、檢字。
本方案屬於音形碼檢字法。
本方案以「自然碼雙拼」爲底層編碼機制。
粗略比較:
| 泛化特徵 | 特點 | |
|---|---|---|
| 音碼 | 單字聲韻 | 低離散。長於詞句。 |
| 音碼加輔 | 單字聲韻+部件字根輔碼 | 較高離散。長於詞句。*輔碼又分音輔、形輔兩類。 |
| 形碼 | 首次三末字根碼 | 低碼長。長於單字。有損拆分。高離散。偏向單拆。 |
| 自然兩分 | 首末部件聲韻 | 低碼長。有損拆分。低離散。單拆。 |
| 自然全分 | 所有部件聲韻 | 較高碼長。無損拆分。高離散。多拆。 |
一、動機
引入一種覆蓋面廣(全字集十萬字)、無需記憶字根(以音馭形)、重碼率低(部件全展開)、兼容多種拆字方式(編碼空間足够大,無懼碰撞)、鍵數適中、無需記憶編碼規則(不限制碼長)、最大化複用使用者原有知識體系的漢字(單字)輸入方案。
以下詳解:
- 覆蓋面廣:首要目標,覆蓋 Unihan 漢字基礎區(字數 20992),擴A~擴J(字數 80992=6592+42720+4160+222+5774+7473+4939+4192+622+4298),額外支持部首區、部首補區、筆畫區、字構區(字數 384=214+116+38+16)(詳見『便捷機制・「部首、筆畫、結構」分類直達』一節)。合計 102368。兼容漢字區永不支持,避免同形異碼混淆。
- 无需記憶字根:不將碼元映射到單個按鍵上,而是將碼元映射到用於指稱部件形狀的音節上,每個碼元編碼兩鍵(雙拼自身特性)。(「碼元」等定義詳見「定義」一節。)本方案提供多種拆字方式,以期實現高命中、低選重的目標。所謂「以音馭形」,識音卽知編碼。所謂「寓形於音」,與「音碼形輔」方案類似處,將部件分形離解爲純音碼;與「音碼形輔」方案不同處,爲純輔或先輔後主,可視作「形輔」已離散揉入編碼中(先輔後主詳見「便捷機制・回環直達」一節)。簡言之,「自然全分」與「音碼形輔」方案核心理念均在於將「整體字音」這個壓縮包解壓,而側重點有所不同。
- 重碼率低:見下文「吴」「吳呉㕦𠯵」例。最均衡碼長 3(鍵數 6)。
- 兼容多種拆字方式:見下文「耒」例、「𧵑」例。對任意單字,不局限於一種拆解方式,無需強記一種拆法。因此「自然全分」之「自然」有兩義:㊀以「自然碼」爲基。㊁天然,本然。無論字理拆法、取大優先、取小優先、直觀近似,兼收並蓄。
- 鍵數適中:大部分單字鍵數在 4~6 之間。就目標而論,不追求最短鍵數。就實效而言,大量常用字在 4 鍵「首次三」選;6 鍵編碼幾乎全部零選重。
- 無需記憶編碼規則:不限制碼長,意味着無需複雜編碼規則(例如限制單字鍵數最大爲四、不同首尾形取法等),同時也意味着能够精確描述所有複雜合字。舉例:「贏」字形近組「嬴𫢃蠃𫢄𦣄𥢵𦣖䇔𨏩驘𦆁⋯」,常規拆分「亡口月*凡」(鍵長 10)(𦆁=亡口月糸凡=
whkbytmifj),進階拆分「吂月*凡」(鍵長 8)(𦆁=吂月糸凡=mhytmifj),兩元拆分「𣎆*」(鍵長 4)(𦆁=𦆁糸=lomi),均支持。使用者儘可盲拆,未命中不是使用者的問題,而是本方案未能盡善之故。因此,「自然全分」之「全分」有兩義:㊀單字完全拆分,而非部分。㊁多種拆字方式,儘可能覆蓋合理舒適度範圍之内的全部排列組合。 - 最大化複用使用者原有知識體系:㊀無需識别單字讀音,識别其組成部件讀音卽可。㊁每個單字平均存在五種拆法,絕大多數字至少有一種拆法拆至常見單字、部首、筆畫範疇。㊂拆法以字理拆法托底,但不避忌字理之外拆法,不避忌交叉拆分,以高命中率爲要。㊃前文已及,無需記憶字根、無需記憶編碼規則。㊄完全繼承已有拼讀體系(以漢語拼音方案爲準)。㊅以自然碼雙拼爲編碼基礎,對全拼使用者雖有一定阻礙,但只有兩位數「聲韻-按鍵」映射需記憶條反(確切地說,是 30 個聲韻,且其中占絕對多數的 21 個聲韻是一一映射),顯著低於多數形碼的三位數字根數量。㊆若使用者已有自然碼雙拼方案使用經驗,則毫無學習成本。㊇其他雙拼方案使用者,則需要適應。如小鶴雙拼方案、微軟雙拼方案等。
「吴」「吳呉㕦𠯵」例
以「吴」字及其異體「吳呉㕦𠯵」爲例。首要考察重碼率。
- 吴=口天=kǒu‧tiān=kbtm。碼長 2(鍵數 4)、重碼 32。首選。
- 吴=口㇐大=kǒu‧héng‧dà=kbhgda。碼長 3(鍵數 6)、重碼 10。首選。
- 吴=口天吴(回環)=kǒu‧tiān‧wú=kbtmwu。碼長 3(鍵數 6)、重碼 1。首選。
- 吳=口𠃑大=kǒu‧yǐn‧dà=kbynda。碼長 3(鍵數 6)、重碼 1。首選。
- 呉=口𠃑=kǒu‧yǐn‧qí=kbynqi。碼長 3(鍵數 6)、重碼 0。單選。
- 㕦=口大=kǒu‧dà=kbda。碼長 2(鍵數 4)、重碼 46。第五。
- 㕦=口㇐人=kǒu‧héng‧rén=kbhgrf。碼長 3(鍵數 6)、重碼 14。首選。
- 㕦=口大㕦(回環)=kǒu‧dà‧huà=kbdahw。碼長 3(鍵數 6)、重碼 0。單選。
- 𠯵=口𠃍=kǒu‧jí‧qí=kbjiqi。碼長 3(鍵數 6)、重碼 0。單選。
「耒」例
以「耒」爲例。首要考察拆字靈活度。
- 耒=二木=èr‧mù=ermu。字理。《說文》:「耒,手耕曲木。从木推丯」。隸定變「丯」爲「二」。
- 耒=丯木=jiè‧mù=jxmu。字理,上溯篆形。《說文》:「丯,象艸生之𢿱亂也」。
- 耒=丰人=fēng‧rén=fgrf。取大優先。
- 耒=㇐未=héng‧wèi=hgwz。取小優先。
- 耒=末㇐=mò‧héng=mohg。直觀近似。
- 耒=三𡭔=sān‧xiǎo=sjxc。直觀近似。
「𧵑」例
以「𧵑」爲例。首要考察拆字靈活度。
- 𧵑=貝古=bèi‧gǔ=bzgu。兩分。碼長 2(鍵數 4)、重碼 6。首選。
- 𧵑=貝十口=bèi‧shí‧kǒu=bzuikb。三分。碼長 3(鍵數 6)、重碼 1。單選。
- 𧵑=目八古=mù‧bā‧gǔ=mubagu。三分。碼長 3(鍵數 6)、重碼 3。首選。
- 𧵑=目八十口=mù‧bā‧shí‧kǒu=mubauikb。四分。碼長 4(鍵數 8)、重碼 0。單選。
附「游遊𫹛䑻蝣𩘓𩹊」例。
- 游=氵斿=shuǐ‧yóu=uvyb。兩分。
- 游=氵𭤨子=shuǐ‧yǎn‧zǐ=uvyjzi。三分。
- 游=氵方𠂉子=shuǐ‧fāng‧wǔ‧zǐ=uvfhrfzi。四分。額外考慮「𭤨」字生僻程度。
「遊𫹛䑻蝣𩘓𩹊」類推不贅。
二、便捷機制
便捷機制是指「常規編碼」之外的「特殊編碼」。這些「特殊編碼」都是「常規編碼」之外的可選編碼,並不強制使用,但若熟練掌握,有事半功倍之效。如下所示:
- 倍碼縮寫。後綴編碼
b*(利用雙拼空碼b+qwertvb),表達某一部件重複 ⑶~⑼ 次。主要目的是壓縮碼長。
- 注:首創機制。
- 注:
b取義「倍」(bèi)。例:ybbq=ybybyb=又×3=又⑶=叒,ybbw=ybybybyb=又×4=又⑷=叕,以此類推。極限壓縮示例:𧆘=艹囗木木木木木木木木木=ckwzmumumumumumumumumu;𧆘=艹囗木×9=艹囗木⑼=ckwzmubb。又如:𡦪=子子子子子子=zizizizizizi;𡦪=子×6=子⑹=zibr。 - 又注:助記符
b(倍),遇「叒」,心流讀若「又倍三」,自鍵盤字母區左上角qwert依次映射34567,3=q,故快速組合取bq。此處空碼組合選取有意爲之,便於記憶。重複次數取範圍 ⑶~⑼,因 ⑶ 以下無壓縮效果,且 ⑼ 以上部件重複在漢字中不存在 。 - 補注:倍碼也可附加在複數碼元之後,用於描述多個部件作爲一個整體重複多次,且無需特殊表達(譬如增加括號或變換順序之類),串流打出卽可。例:𨽰=阝山人儿山人儿山人儿=阝山人儿×3=
fuujrferbq,其中「山人儿」三個部件作爲一個整體重複三次,只需將「bq」簡單附加在整體之後,無需特殊表達(向上「阝㞤儿×3=fuynerbq」同理,再向上「㞤儿」則不成獨字)。 - 補例:「又双(㕛)叒叕」[yòu‧shuāng‧(yǒu)‧ruò‧zhuó]。「火炎(炏)焱()(㷋)燚」[huǒ‧yán‧(yán)‧yàn‧(fán)‧(tán)‧yì]。「日昍晶」[rì‧xuān‧jīng]。「口吅(吕)品㗊𠾅」[kǒu‧xuān‧(lǚ)‧pǐn‧jí‧yín]。「子孖孨(𡥦)𡦪」[zǐ‧mā‧zhuǎn‧(nǐ)‧jí]。
f*(利用雙拼空碼 f+qwertnmx),表達漢字結構 ⿰⿱⿴⿵⿸。主要目的是快速去重。- 注:靈感源自「王碼五筆」「結構識别碼」。
- 注:
f取義「分」(fēn)。例:dadafq=大大⿰=夶,dadafw=大大⿱=㚐,以此類推。 - 又注:注意
f之後*亦是qwert起始。空碼組合特意取與b*相仿。助記符f(分),遇「夶」(大大⿰),心流讀若「大大分左右」,故組合取fq。 - 尾注:⿰⿱⿴⿵⿸,分别解讀⸺⿰:左右;⿱:上下;⿴:全包圍;⿵:三包圍(聚合並代表⿵⿶⿷);⿸:兩包圍(聚合並代表⿸⿺⿹);:左右鏡像;:上下鏡像;:移除部件。
- 附注:從實用角度出發,本方案實際編碼中以「⿰⿱」爲主,這是爲了避免因過度分析化而導致打斷心流。
- 注:「」例:「𣱱=水㇐=
uvfxhg」。 - 注:「」是惟一例外的中綴編碼,因爲這樣理解起來更自然。試比較:「𩤷=馬亞㇐=
mayahgfx」(廢案)與「𩤷=馬亞㇐=mayafxhg」(定案)。
- 注:靈感源自「自然兩分」。「自然兩分」中有零星見例,本方案將此擴展應用至 1800+ 字。
- 例:雨隹霍=
yuvvho=霍[huò]。羽隹翟=yuvvdi=翟[dí,zhái]。羽隹𦑏=yuvvil=𦑏[chài]。
bs*」,筆畫編碼「bh*」,結構編碼「jg*」。- 注:靈感源自「魔然」方案中「
pp」前綴引導「偏旁」編碼。 - ㊀前綴爲相應分類簡拼。
- ㊁打出前綴卽可得相應分類下所有字符。
- ㊂若需直達某字符,則續打出相應稱呼簡拼(有例外,見後)。例:
jgzy=結構左右=「⿰」、jgjxzy=結構鏡像左右=「」。bhwg=筆畫臥勾=「㇃」、bhph=筆畫撇橫=「㇜」。bsuv=部首水=「⽔⺡⺢」次選「⺡」。(注:部首因其數量衆多⸺330 個,所以同時適用簡拼、雙拼、乃至雙拼帶單輔碼。例如bsu有 33 候選,略過不提。bsuv已見前文,3 候選。bsuvd=「⺡⺢」首選「⺡」,輔碼規則與自然碼輔碼方案同。) - ㊃其中「
bs」自身爲稀疏碼,在常規自然碼雙拼方案中僅對應一字「」,在本方案中對應零字(不參與組字)。「bh」自身爲稀疏碼,在本方案中僅對應四字「𮫠帮幚𫑢」。「jg」自身爲空碼。 - ㊄稱呼清單數百,恕不完整列出。使用者可自行猜測/嘗試,或依靠 rime 反查方案中前綴打出後候選列表中可見的後續編碼提示。
qx → qo,xq → xo,wz → wk)。完全可選,原組合 qx、xq、wk 仍可用。qo、xo、wk 本是空碼,屬回收再利用。oj、of 後綴編碼,分别指定「簡繁」(ⒿⒻ)。例:「嵸𡵝」「嵷𰎌」=「山從」「山从」=ujcs。「𡵝𰎌」=ujcsoj,「嵸嵷」=ujcsof。- 注:首創機制。
- 可與「結構識别」結合。如:「𡵝=山从⿱Ⓙ=shān‧cóng‧⿱‧Ⓙ」=
ujcsfwoj(縱簡),「𰎌=山从⿰Ⓙ=shān‧cóng‧⿰‧Ⓙ」=ujcsfqoj(橫簡),「嵸=山從⿱Ⓕ=shān‧cóng‧⿱‧Ⓕ」=ujcsfwof(縱繁),「嵷=山從⿰Ⓕ=shān‧cóng‧⿰‧Ⓕ」=ujcsfqof(橫繁)。 - 可與「回環直達」結合。如:「𡵝=山从𡵝Ⓙ=shān‧cóng‧zōng‧Ⓙ」=
ujcszsoj(zōng簡),「𰎌=山从𰎌Ⓙ=shān‧cóng‧sǒng‧Ⓙ」=ujcsssoj(sǒng簡),「嵸=山從嵸Ⓕ=shān‧cóng‧zōng‧Ⓕ」=ujcsssof(zōng繁),「嵷=山從嵷Ⓕ=shān‧cóng‧sǒng‧Ⓕ」=ujcsssof(sǒng繁)。 - 類似的還有:責责,斬斩,軍军。
三、編碼空間
以漢語拼音有效音節爲碼元,數量爲 405。
兩碼元編碼空間=405²=16ˍ4025。簡稱「兩元四鍵」。重碼較多,但對於少量字,仍能首選或零重。
三碼元編碼空間=405³=6643ˍ0125。簡稱「三元六鍵」。重碼較少,最實用的碼長。
四碼元編碼空間=405⁴=269ˍ0420ˍ0625。簡稱「四元八鍵」。重碼極少,較少使用。
四、定義
- 碼元:編碼單元。在本方案中,編碼單元爲任意漢字部件,包括:獨字、偏旁、部首、筆畫。例:獨字「手」、偏旁「扌」、部首「龵」、筆畫「㇐亅㇀」[héng‧jué‧tí]。
- 碼長:碼元長度。每個碼元取其無調拼音,編碼爲雙拼;按部件順序依次編碼;不限制最終編碼的長度。
- 鍵數:按鍵數量。按鍵數量=碼長×2。
- 碼序:部件編碼順序。基本原則有三:㊀先上後下/先左後右。不強求與筆順相同。㊁包圍結構,先框架、後内容,優先級高於原則㈠。如「襵=衤聶=衤耳聑=衤耳耳耳=衤耳×3」(應用原則㈠)。如「山=凵㇑」(而非「㇑凵」)(應用原則㈡)。「武=戈止」(原則㈠㈡皆符合,且字中「㇐弋」實爲「戈」變體)。「哉=𢦏口=十戈口」(而非「戈十口」)(此處融合應用兩條原則且不牴觸,「戈」只包圍左下空間,否則恐怕要叫做「中央包圍地方」)。如「亾=𠃊人」(而非「人𠃊」)(應用原則㈡)。㊂内容超出框架,則先内容、後框架。
- 重碼:任一編碼的重複單字數量。固定減一,卽某編碼若僅包含一個候選,則重碼=0。
- 單字:待編碼字。區别於用作漢字部件的「獨字」。
- 部件:組成單字的基本單元。包括:獨字、偏旁、部首、筆畫。
- 獨字:旣可作單字,亦可作部件。
- 偏旁:合體字的構字部件。古稱左部部件作「偏」,右部部件作「旁」,現統稱「偏旁」。分「表義形旁」與「表音聲旁」兩類。
- 部首:特指表義偏旁,卽「形旁」。常規部首 214 個,擴展部首 116 個。又分「識字部首」與「檢字部首」兩類。
- 筆畫:38 個。筆畫均有稱呼,但並非都有單音節讀音,故只取其中一部分作構字編碼之用。典型如:「㇐㇑㇒㇏㇔㇣」(héng‧shù‧piě‧nà‧diǎn‧quān)。特别地,本方案在使用以上筆畫時,均不使用獨字「一丨丿乀丶〇」(yī‧gǔn‧piě‧fú‧zhǔ‧líng)作替代,特此說明。(但其中獨字「丿」仍間或使用,讀音與筆畫「㇒」相同,不影響最終結果。僅爲中間産物精確描述字形計。)
- 兩分:將單字完整拆分爲兩個碼元(部件)。「三分」「四分」以此類推。
- 拼式:單字拼合方式。與拆法一體兩面。拆法描述從單字到部件,拼式描述從部件到單字。
五、實例
實例主要用於瞭解拆字思路、基本原則。
- 優先拆作獨字,其次偏旁部首,最次筆畫。可知基本原則爲逐級「自頂向下」,而非「自下而上」、用「有限字根」去匹配「近乎無限組合」。
- 部件存在多個拆分層級時,均作支持,卽使較高層級存在較高重碼率。較高層級拆分重碼率高、易用性高、易識别性低。較低層級重碼率低、易用性低、易識别性高。換句話說,不避重碼。對單個字來說,由於支持多種拆解方式,卽使某種拆法重碼多,在另一種拆法中也可能零重碼。易知設計哲學是「舒適度優先」,讓使用者多種拆法都能命中,打得出;其次使用者通過深入使用,自然能找到舒適度與重碼率兼顧的最優拆法。
- 不無限拆分。首先兩分拆解廣泛存在(易用性最高),其次主要覆蓋三分拆解(重碼率與易用性最均衡),再次覆蓋四分拆解(重碼率最低)。而少量無法兩分、三分、四分的複雜合字,則任其自然。
- 部件取音原則,優先標準音,其次儘量離散。如「人」[rén]、「𠂉」[wǔ]之分(而非歸并到「人」[rén]),「冂」[jiōng]、「凵」[kǎn]、「匚」[fāng]、「コ」[kuàng]之分(而非歸并到「框」[kuàng]),「口」[kǒu]、「囗」[wéi]之分(而非歸并到「口」[kǒu]),「月」[yuè]、「⺝𱼀⺼」[ròu]之分(而非歸并到「月」[yuè]。一般規律是,部件在左通常爲[yuè],在右/下通常爲[ròu])。「糹纟」[sī]、「糸」[mì,sī]之分(而非歸并到[sī]或[mì])。
- 取音原則中,存在少量例外。例如不區分「阝」[fù](阜)(左包耳)、「⻏」[yì](邑)(右包耳),歸并作「阝」[fù](左包耳),並非識别或認同上的考量,而是[yì]這個音節在部件之中大量存在,屬於「熱區」,處於離散度考慮,予以避免。又如「夂」[zhì]、「夊」[suī]歸并作「夂」[zhì](「夊」僅有少量認定使用,數量不過百,「夂」則在千數),則是識别難度的考量,字形差異過小(獨字已難區分,何況兩者多在下部,加劇了識别難度);一是使用者難以目視區分,二是各地區標準不一、同一碼位單字字形往往不同,三是不同字體廠家又有不同程度的舛誤;與此形近的「攵」[pū]則如常,通常在右部而較易識别,且訛誤較少;「文」[wén]亦如常。其餘詳見「附錄:部件編碼速查表」一節(此表只收「生僻、多音、易混」部件)。
- 部件需要有音,無音部件不作選取(不強行定音)。這意味着從源頭避免使用大量存在的喃字、K源字、J源字、T源戶政字作部件,從而讓使用者不必爲這些字的(人爲、非標、無法)定音糾結。
「𢌋」例
𢌋,同「廡」[wǔ]。「廡」字依然生僻?組詞「廊廡」,大致能揣測字義。
代表一類字,單字、部件均生僻。
「𢌋」字如何拆分?「广」「大」清晰無誤,通過簡化字思路,合作「庆」。下部「𣚨」字生僻。再拆「𣏼𣏼」,仍然生僻。再拆「廿木廿木」。
如此一來,有三種拆法:
- 庆𣚨=qìng‧wú=qywu。(有重碼 21,其中首選「毒」兼容臺標字形「龶毋=qywu」)
- 庆𣏼𣏼=qìng‧huá‧huá=qyhwhw。(重碼 0)
- 庆廿木廿木=qìng‧niàn‧mù‧niàn‧mù=qynmmunmmu。(重碼 0)
三種拆法均作支持,兼容不同熟悉程度。
「丅十𠃍、丄𠃊𠃎」例
對音碼方案或音主形輔方案而言,筆畫越少的字,通常有越難檢索的趨勢。在本方案中,這不是問題。
輸入 hguu,指稱筆畫「㇐㇑」(héng‧shù),第一二三候選依次爲:「丅十𠃍」(xià‧shí‧jí)。若希望快速去重,利用可選「回環直達」機制(詳見「便捷機制」一節),尾部附加本字碼元,如「𠃍」=hguuji,可將「𠃍」推至首選。
輸入 uuhg,指稱筆畫「㇑㇐」(shù‧héng),第一二三候選依次爲:「丄𠃊𠃎」(shàng‧yǐn‧gōu)。
「吕、吅」例
代表一類字,卽字内包含相同部件,且字間具備不同結構。
常規編碼,吕=吅=口口=kbkb,需選重。
可選「結構識别」機制下(詳見「便捷機制・結構識别」一節),吕=口口⿱=kbkbfw,吅=口口⿰=kbkbfq。
注:所有此類含且僅含相同部件的單字,均已應用該機制。
「群、羣」例
代表一類字,卽字内包含不同部件,且字間具備不同結構。
常規編碼,群=羣=君羊=jpyh,需選重。
可選「結構識别」機制下(詳見「便捷機制・結構識别」一節),群=君羊⿰=jpyhfq,羣=君羊⿱=jpyhfw。
注:此類單字,僅部分應用該機制,並不全體應用(主要是工作量問題)。
「衍、聞、裏、贏、斑、辦、鬭、㱿」例
代表一類字,特殊複合獨字,中置其他部件。
行=彳亍[chì‧chù]。衍=行氵=彳氵亍。注:「彳」,小步。「亍」,步止。合爲「行」走。
門=𠁣𠃛[jì‧yà]。聞=門耳=𠁣耳𠃛。注:「𠁣」,門左。「𠃛」,門右。合爲「門」戶。「𠁣𠃛」象開關門聲。
衣=亠𧘇[tóu‧yī]。裏=衣里=亠里𧘇。注:「亠」,《字彙》:「徒鉤切,音頭。義闕」。「𧘇」,漢字部件,「衣表」下部。喃字。無音,取「衣」。
𣎆=吂月凡=亡口月凡。贏=𣎆貝=吂月貝凡=亡口月貝凡。注:「𣎆」[luò],獸名,象形。「吂」[máng],默然,遲鈍。
玨=王王。斑=玨文=王文王。班=玨𬼀=王𬼀王。注:「玨」[jué],同「𤤴」「珏」。注:「𬼀」[wéi],J源,同「為」。借形作部件。
辡=辛辛。辦=辡力=辛力辛。辨=辡𬼀=辛𬼀辛。注:「辡」[biàn],「辯」之初文。
鬥=𩰋𩰊[jú‧jǐ]。鬭=鬥斲=𩰋斲𩰊。鬪=鬥𭔰=𩰋𭔰𩰊。
㱿=𣪊=𡉉殳[què‧shū]=𡉉几又[què‧jī‧yòu]。𣪺=𣪊糸=𡉉糸殳。注:「㱿」(𣪊)[què,hù,qiǎng]。《說文》:「㱿,从上擊下。从殳𡉉聲。」
「𢀓、𠆭、𦮙」例
代表一類字,卽包含特殊筆畫。
𢀓,T、J 源,同「巨」。如何表達?⸺「工㇣㇣」(gōng‧quān‧quān)(其中筆畫「㇣」〔quān〕在某些字體中視覺上接近數字「〇」〔líng〕),編碼 gsqrqr。
𠆭,G、T、J 源,同古文「𩃬」(陰,侌)。拆分「亼㇐㇣」(jí‧héng‧quān),編碼 jihgqr。字理拆分「今云」(jīn‧yún、同「侌」),編碼 jnyp。
𦮙,T、J 源,同「葵」。拆分「艹屮屮屮屮」(cǎo‧chè‧chè‧chè‧chè),其中四個「屮」部件各以不同角度旋轉,不作特殊表達,編碼 ckieieieie。利用可選「倍碼縮寫」機制(詳見「便捷機制・倍碼縮寫」一節),則表達爲「艹屮×4」或「艹屮倍四」,編碼 ckiebw。
六、致謝
- 初始拆分數據:漢語拆字字典|kfcd/chaizi,含 1,7803 字、2,7603 拆法。
- 拆分參考/補充:字統網|zi.tools。
- 初始拼音庫:中文转拼音、拼音音调、拼音声母、拼音韵母、多音字拼音、姓氏拼音、拼音匹配、中文分词|zh-lx/pinyin-pro。
- 補充拼音庫:汉字拼音转换工具(Python 版)|mozillazg/python-pinyin。
- 讀音參考:字統網|zi.tools。
- 讀音參考:葉典網|yedict.com。
- 讀音參考:漢典網|zdic.net。
- 輸入部件所用主力輸入法:魔然|zrmfans.cn
- 全字集字庫,提供字形一致全字集文字顯示:天珩字庫|cheonhyeong.com。
七、後編
本方案啓動於 2025 年 4 月中,完成於 2026 年 5 月初。
爲確保質量,全程堅持手工拆解,謹慎使用現存公開數據(有大量修正),不使用爬蟲爬取數據(僅手動查詢音形義且交叉比對),不使用自動拆分工具(例如 汉字自动拆分系统|chaifen.app)。在完善過程中,自舉程度越來越高,並順帶完成大量測試與糾錯。
我享受這個過程,希望作爲使用者的你,也享受使用過程。
附錄一:部件編碼速查表
用於速查生僻、多音、易混部件的編碼、讀音。
注:下表中多音部件列出所有(或至少大部分)讀音,而統一取用首個讀音作編碼。讀音順序確定原則爲義項多寡爲主、義項通用程度爲輔。
注:下表「解釋」列中文字提及「通用」「覆蓋」者,一般指拆字過程中優先認定並使用前者,較少使用後者。前者大多在輸入時通行無礙,後者則在部分字中可選可用。
注:排序首先按筆畫數倒序,異於字典部首檢字序,同於本方案自頂而下觀(從趣味性上說,筆畫過於無趣,也應該放在最末)。其次按起筆「㇐㇑㇒㇏㇔㇣」排序,大致同於部首檢字序。再次按相關性分組,允許不同筆畫數部件相鄰,標記以「對照」。
| 部件 | 編碼 | 讀音 | 認同 | 見例 | 解釋 |
|---|---|---|---|---|---|
| \獨字|十七畫/ | |||||
| 龠 | yt | yuè | 籥,鑰 | ||
| \獨字|十二畫/ | |||||
| 歯 | ii | chǐ | 齒 | 噛,齢,𫠚 | |
| 齿 | ii | chǐ | 齒 | 啮,龀,龁 | 對照「齒」。 |
| 黽 | mn | mǐn,miǎn,méng,měng | 僶,澠,竃 | ||
| 黾 | mn | mǐn,miǎn,méng,měng | 黽 | 渑,绳,蝇 | |
| 黹 | vi | zhǐ | 黺,黻,黼 | ||
| \獨字|十一畫/ | |||||
| 乾 | qm | qián,gān | |||
| 鹵 | lu | lǔ | 鹹,塷,滷 | ||
| 𱕻 | wz | wèi | 鹵,𠷝,𠿥 | ||
| 𠂭 | mi | mǐ,bì | 鹵,𠚍,鬯 | ||
| 𠚍 | ih | chàng | 𠚍,鬯 | ||
| 鬯 | ih | chàng | 暢 | 鬰,𡏓,𥠴 | 古文「暢」。 |
| 亀 | gv | guī,jūn,qiū | 龜 | 穐,䆴,䦰 | |
| 龟 | gv | guī,jūn,qiū | 龜 | 阄,𫃧,𫜳 | |
| \獨字|十畫/ | |||||
| 髟 | bc | biāo | 髮,鬢,鬚 | 「彡」見後。 | |
| 镸 | ih | cháng | 長 | 髟,𨲊,𨲜 | 「長」之變體。 |
| 鬥 | db | dòu | 對照「𩰋𩰊」。 | ||
| 𩰋 | ju | jú | 𠨭 | 鬥,鬬,鬪 | 持。 |
| 𩰊 | ji | jǐ | 丮 | 鬥,鬬,鬪 | 握持。 |
| 𠨭 | ju | jú | 𩰋 | 持。零見例。轉「𩰋」。 | |
| 丮 | ji | jǐ | 𩰊 | 𨑽,𤜾 | 握持。 |
| 竜 | ls | lóng | 龍 | 槞,滝,篭 | |
| 龙 | ls | lóng | 龍 | 厐,咙,垄 | |
| \獨字|九畫/ | |||||
| 韋 | wz | wéi | 偉,韍 | 後簡作「韦」。 | |
| 𭇁 | wu | wú,yù | 吾 | 韋 | 「韋」之上部。 |
| 𫝀 | wu | wǔ | 五 | 𭇁 | 「𭇁」之上部。 |
| 㐄 | kw | kuà | 舛 | 對照「韋」「舛」。 | |
| 舛 | ir | chuǎn | 舜 | 對照「㐄」。相背。錯誤。 | |
| \獨字|八畫/ | |||||
| 靑 | qy | qīng | 青 | \ | 「青」之變體。 |
| 円 | yr | yuán | 靑,𮃇 | 「靑」之下部。見例個位數。 | |
| 隹 | vv | zhuī,cuī,wéi | 雀,雁,誰 | 總稱「鳥」。 | |
| 斉 | qi | qí,jì,zī,zhāi | 齊 | 剤,済,㑪 | |
| 齐 | qi | qí,jì,zī,zhāi | 齊 | 侪,剂,挤 | |
| \獨字|七畫/ | |||||
| 𦣻 | ub | shǒu,bǎi | 首,(百) | 頁,夏 | |
| ⻡ | ub | shǒu | 首 | 𡭎,䭬,𡭑 | 對照「𦣻」。 |
| 豕 | ui | shǐ | 豕,逐 | 公豬。 | |
| 㒸 | sv | suì | 隊,遂 | 對照「豕」[shǐ]。「遂」之初文。 | |
| 豸 | vi | zhì,zhài | 貓,貌 | 對照「𧰨」[gèng]。嘼。蟲。 | |
| 𧰨 | gg | gèng | 豕 | 對照「豕」[shǐ]。《海篇》「古嶝切,音艮。聚也。」 | |
| 乑 | yn | yín | 㐺 | 衆 | 對照「𧰨」[gèng]「㐺」[yín,zhòng]。「㐺」之變體。衆立貌。又「衆」之省變體。 |
| 㐺 | yn | yín,zhòng | 㐺 | 對照「乑」[yín]。衆立貌。又「衆」[zhòng]之初文。 | |
| 𫡑 | yn | yín,zhòng | 㐺 | 眾 | 對照「㐺」[yín,zhòng]。衆立貌。「㐺」之變體。又「眾」[zhòng]之省變體。 |
| 衆 | vs | zhòng | ⿱日㐺 | 商甲骨上部从「日」,周金文訛變作「目」,秦漢篆隸訛作「罒」,楷化訛變作「血、罒」。大陸以此爲正。 | |
| 眾 | vs | zhòng | ⿱日㐺 | 商甲骨上部从「日」,周金文訛變作「目」,秦漢篆隸訛作「罒」,楷化訛變作「血、罒」。臺灣以此爲正。 | |
| 众 | vs | zhòng | 衆,眾 | 「衆眾」之近古省變體、簡體。 | |
| 𰁧 | cs | cóng,zòng | 從 | 類推簡「從」。與「㐺」[yín,zhòng]音義大異。 | |
| 皃 | mk | mào | 貌 | 貌 | 「貌」之初文。 |
| 芈 | mi | mǐ | 芈,哶,蝆 | ||
| 䖝 | gf | chóng | 虫 | 風,𧔗 | 古文「虫」。 |
| \獨字|六畫/ | |||||
| 耒 | lz | lěi | 耒,耜 | 農具。 | |
| 幵 | jm | jiān | 筓 | 「筓」[jī]之初文。 | |
| 西 | xi | xī | 覀,襾 | 要,覃 | 覆蓋「襾」「覀」。 |
| 襾 | ya | yà,xī | 覀 | 要,覃 | 通用「西」。 |
| 覀 | ya | yà,xī | 襾 | 要,覃 | 通用「西」。 |
| 㫐 | yk | yǎo | 即,既 | 「即既」左部巖式認定。 | |
| 皀 | ji | jí,bī | 卽,旣 | 「卽旣」左部巖式認定。 | |
| 艮 | gf | gèn,gěn | 良,即,既 | 「即既」左部寬式認定。 | |
| 旡 | ji | jì | 旣,既 | 對照「㫐」「皀」。 | |
| 虍 | gf | gèn,gěn | 虎,𧆞,䖈 | 虎紋。 | |
| 囬 | hv | huí | 回 | 面 | |
| 囘 | hv | huí | 回 | 𠄢 | 對照「囬」。 |
| 艸 | ck | cǎo | 草 | 芔,𠔖,𨴔 | 百草。「草」之本字。 |
| 屮 | ie | chè,cǎo | 艸,出,㞢 | 象草木初生。 | |
| 艹 | ck | cǎo | 艸 | 草,荅,䒢 | 對照「艸」。 |
| 卝 | gr | guàn,kuàng | 丱 | 𦍋,㐀 | 「丱」之變體。對照「艹」。 |
| 丱 | gr | guàn,kuàng | 象幼童束髮如角貌,總角。對照「卝」。 | ||
| 兇 | xs | xiōng | 凶 | 兇,䣴,𧵮 | |
| 㐫 | xs | xiōng | 凶 | 離,离 | 對照「兇」。 |
| 臼 | jq | jiù | 臼,𡘑 | 下橫封口。 | |
| 𦥑 | ju | jú,jǔ,póu | 與,興,輿 | 下橫開口。對照「臼」。 | |
| 釆 | bm | biàn | (番),(播) | 番 | 辨别,象獸爪分别。一說會翻土播種之意。「番」之初文。「播」之初文。與「采」[cǎi](爫木)異,「釆」=「㇒米」。 |
| 采 | cl | cǎi,cài | 舜 | 从爪(爫)从木,會意摘取。 | |
| 聿 | yu | yù | 聿,筆 | 「筆」之初文。 | |
| 肀 | yu | yù | 聿,筆 | 「聿」之省體。 | |
| ⺻ | yu | yù | 書 | 「聿」之變體。 | |
| \獨字|五畫/ | |||||
| 𣄼 | hp | hūn | 昏,昬 | 近古造字。从倒「旦」,會意,「日」在「㇐」(地)下。 | |
| 旦 | dj | dàn | 上古字。對照「𣄼」。 | ||
| 𠮛 | vi | zhǐ | 旨 | 近古省變體,上從「匕」省,下從「日」省。 | |
| | dj | dàn | 旦 | 近古省變體,上從「日」省。對照「旦」。 | |
| 疋 | pi | pǐ,yǎ,shū | 胥,蛋 | ||
| 𤴔 | uu | shū,pǐ,yǎ | 疏 | 對照「疋」。 | |
| 𤴓 | ya | yǎ | 是 | 對照「疋」。 | |
| \獨字|四畫/ | |||||
| 毋 | wu | wú | 勿,無 | 𩬍,毎,毐 | 作偏旁時,中竪多不出頭。惟「毐」例外。 |
| 毌 | gr | guàn | 貫,𪞈 | 右下作竪,不作勾。對照「毋」。 | |
| 爿 | pj | pán,qiāng | 牀,壯,狀 | ||
| 丬 | pj | pán,qiāng | 爿 | 壮,状 | 對照「爿」。 |
| 龵 | ub | shǒu | 手 | 看,拜 | |
| 扌 | ub | shǒu | 手 | 搭,找 | 對照「龵」。 |
| 殳 | uu | shū | 殳,役 | ||
| 禸 | rb | róu | 厹,蹂 | 禺,离 | |
| 厹 | rb | róu | 禸,蹂 | 𣓕,𣽕 | 對照「禸」。 |
| 夬 | gy | guài,jué | |||
| \獨字|三畫/ | |||||
| 𡭔 | xc | xiǎo | 小 | 少,雀,尖 | 「小」之變體。 |
| ⺌ | xc | xiǎo | 小 | 肖,当,𭕆 | 「小」字頭。 |
| 𭕄,⺍ | xt | xué | 「⺌」之變體。作「学」字頭。 | ||
| ⺗ | xn | xīn | 心,忄 | 𠇍,𢛩 | |
| \獨字|二畫/ | |||||
| 𠂆 | yi | yì | 抴 | 虒,𠂋,后 | 與「厂」[chǎng,hǎn,ān]異。 |
| 𰀪 | yi | yì | 𠂆,抴 | 勿,𠃓,彡 | 兩「㇒」[piě]。 |
| 彡 | uj | shān,xiǎn | 彩,杉,彣 | 三「㇒」[piě]。 | |
| 丿 | px | piě | 右戾也。象左引之形。同筆畫「㇒」。 | ||
| \偏旁|八畫/ | |||||
| 飠 | ui | shí | 食 | ||
| ⻞ | ui | shí | 食 | ||
| 饣 | ui | shí | 食 | 對照「飠」。 | |
| \偏旁|七畫/ | |||||
| 辵 | io | chuò | 𫐳,𡿽 | ||
| 辶 | io | chuò | 辵 | 達,巡 | 覆蓋「⻍」「⻎」。 |
| ⻍ | io | chuò | 辵 | 達,巡 | 字形異。通用「辶」 |
| ⻎ | io | chuò | 辵 | 達,巡 | 字形異。通用「辶」 |
| ⻊ | zu | zú | 足 | 踢,蹕 | |
| 廴 | yn | yǐn,yìn | 建,延 | ||
| \偏旁|六畫/ | |||||
| 𠕋 | ce | cè | 冊,册 | 𠱡,𨀢 | |
| 𠕁 | cs | cóng | 龠,扁 | 義「孔」。對照「𠕋」。 | |
| 𥫗 | vu | zhú | 竹 | 答,篇 | |
| 糹 | si | sī,mì | 絲,䋪 | 「糸」之變體。 | |
| 纟 | si | sī,mì | 糹 | 绂,纰 | 「糹」之草變體、簡體。 |
| 糸 | mi | mì,sī | 糹 | 糸,絲 | 「糹」之初文。取古音以示位置有别(多在下/右)。 |
| 𦍌 | yh | yáng,xiáng,rèn | 羊 | 義,羲 | 「羊」在上部之變體。 |
| ⺶ | yh | yáng | 羊 | 差,着 | 「羊」在上部之變體。 |
| \偏旁|五畫/ | |||||
| 𠁣 | ji | jì | 門 | ||
| 𠃛 | ya | yà | 門 | 對照「𠁣」。 | |
| 門 | mf | mén | 閒,閑,間 | 對照「𠁣𠃛」。 | |
| 罒 | wh | wǎng | 网 | 𡶩,罷 | |
| 㓁 | wh | wǎng | 网 | 罕,𦉲,𦊅 | 對照「罒」。 |
| 罓 | wh | wǎng | 网 | 𡵠,𢌺 | 對照「罒」。 |
| 𠕀 | wh | wǎng | 网 | 𢁶,𩖩,𫙑 | 對照「罒」。 |
| 𦉫 | wh | wǎng,rén | 网 | 而,𦊉 | 對照「罒」。 |
| 月 | yt | yuè,ròu | 月,肉 | 刖,朕,明 | 「肉」源别見獨字「𱼀」、部首「⺝⺼」。 |
| 𱼀 | rb | ròu,yuè | 肉 | 然,祭,豋 | 多在上。 |
| ⺝ | rb | ròu | 肉 | 肙,䏍 | 多在右或下。 |
| ⺼ | rb | ròu | 肉 | 胐,脁 | 多在左。 |
| ⺜ | mk | mào | 帽 | 帽,冒,冐 | 「帽」之初文。區别「日曰」。 |
| 疒 | ne | nè,bìng | 病,痾 | ||
| \偏旁|四畫/ | |||||
| 龶 | qy | qīng | 青,𫠤,𭃌,毒 | 部件「青字頭」,音取「青」。 | |
| 耂 | lk | lǎo | 老,考 | 者 | |
| ⺧ | nq | niú | 牛,牜 | 告,先,𭇆 | 「牛」作上下偏旁之變體。僅「告」等三例。 |
| 牜 | nq | niú | 牛,⺧ | 牝,牡 | 「牛」作左側偏旁之變體。 |
| 爫 | vk | zhǎo,zhuǎ | 爪 | 寽,䍃 | |
| 灬 | ho | huǒ,biāo | 火 | 然,魚,麃 | 「biāo」音僅見《集韻》《類篇》。 |
| 礻 | ui | shì | 示 | 祀,禮 | |
| 衤 | yi | yī | 衣 | 襖,襬 | 對照「礻」。 |
| \偏旁|三畫/ | |||||
| 囗 | wz | wéi,guó | 圍,國 | 圍,國,国,囯 | 古文「圍」。古文「國」。部件「外包圍」。 |
| 彐 | ji | jì | 录 | 下橫出頭(部分字體字形錯誤)。 | |
| ⺕ | ji | jì | 彐 | 隶 | 中橫出頭(部分字體字形錯誤)。 |
| 𫜹 | xt | xuě | (雪) | 雪 | 三橫等長。壯字,用同「雪」。同「雪」,二簡字。 |
| 𰀂 | nt | nüè | (虐) | 虐 | 中橫出頭。同「虐」,二簡字。 |
| 𰀄 | nt | nüè | (虐) | 三橫等長。同「𰀂」。 | |
| 廾 | gs | gǒng | 弁,戒,开 | ||
| 弋 | yi | yì | 戈,代 | ||
| 𫠠 | yi | yì | 弋,氏 | 對照「弋」。 | |
| 尢 | wh | wāng,yóu | 尤,尬,𡯥 | ||
| 尣 | wh | wāng | 𧉇,尦,𫵒 | 對照「尢」。 | |
| 𡯂 | wh | wāng | 𡰇(臺標) | 「尣」之臺標字形。對照「尢」。 | |
| 彳 | ii | chì | 行,衍 | ||
| 亍 | iu | chù | 行,𠼫 | 對照「彳」。 | |
| 行 | xy | xíng,háng,hàng,héng | 䘖,衏,衐 | 對照「彳亍」。 | |
| 巛 | ir | chuān,shùn | 川 | 巡,巠 | |
| 𫶧 | ir | chuān,shùn | 川 | 㐬,巟 | |
| 犭 | qr | quǎn | 犬 | 𤟉,獓 | |
| 夂 | vi | zhǐ,zhōng | 各,夅,夏 | 本義「後至」。覆蓋「夊」。 | |
| 夊 | sv | suī | 𡕞 | 通用「夂」。 | |
| 攵 | pu | pū | 攴 | 放,𢼄,致 | |
| 攴 | pu | pū | 攵 | 寇,敍,㢭 | |
| 歺 | dl | dǎi | 歹 | 𣦼,𣦸,𣦷 | |
| 宀 | mm | mián | 室,穴 | ||
| 冖 | mi | mì | 㓁,軍,冝 | 對照「宀」。 | |
| 穴 | xt | xué | 𥥛,𥤻 | 對照「宀」。 | |
| 彑 | ji | jì | 互,彔 | ||
| \偏旁|二畫/ | |||||
| 匚 | fh | fāng | 區 | 框右開口。 | |
| 匸 | xi | xì | 亡 | 框右開口,上橫出頭。 | |
| コ | kd | kuàng | 尸,㠯,𠂤 | 框左開口。假名,借形。💡音作「框」。 | |
| 冂 | js | jiōng | 冂,冋,冏 | 框下開口。 | |
| 凵 | kj | kǎn,qiǎn | 山屮 | 框上開口。 | |
| 厂 | ih | chǎng,hǎn,ān | 厰,巖 | ||
| 广 | gd | guǎng,yǎn,ān | 廣,廈 | 對照「厂」。 | |
| 卜 | bu | bǔ,bo,pú | 占卜。 | ||
| ⺊ | bu | bǔ,bo,pú | 卜 | 攴,占 | 「卜」之變體。 |
| 卩 | jx | jié | 節 | 「節」之變省體。 | |
| 阝 | fu | fù | 阜 | 「阜」之變省體(左包耳)。覆蓋「⻏」[yì]。 | |
| ⻕ | fu | fù | 阜 | 「阜」之變體。 | |
| ⻏ | yi | yì | 邑 | 「邑」之變省體(右包耳)。通用「阝」[fù]。 | |
| 𠂉 | wu | wǔ,rén | 午,(人) | 午,气,乞,㐌 | 「人」作上部偏旁之變體,音取「午」,區分。 |
| ⺈ | dk | dāo | 刀 | 亇,負,刍 | |
| 刂 | dk | dāo | 刀 | 刈,刊,刑 | |
| 𠂊 | dk | dāo | 刀 | 夕,夂,夊 | |
| 厶 | si | sī,mǒu | 公,厷,幺 | ||
| 乂 | yi | yì | 刈 | 刈,爻,义 | 除草,後作「刈」。覆蓋「㐅」。 |
| 㐅 | wu | wǔ | 五 | 爻,义 | 古文「五」。通用「乂」。 |
| 爻 | yk | yáo | 爻,𢂞,𢁫,𠛄 | 卦象。對照「乂」「㐅」。 | |
| 亠 | tb | tóu,èr | 文 | ||
| ⺀ | fu | fù | 枣(棗) | 重元符,表部件重複。音取「複」。見例百數。 | |
| 々 | fu | fù | 𡵁,𡖸 | 重文符,表文字重複。音取「複」。見例極少。對照「⺀」。 | |
| 冫 | by | bīng | 仌,冰 | 冸,冲 | |
| 氵 | uv | shuǐ | 水,氺 | 泮,沖 | 對照「冫」。 |
| 氺 | uv | shuǐ | 水,氵 | 泰,𣱹,𱥯 | 對照「氵」。 |
| 㔾 | fj | fàn,jié,xiān | 犯,卷 | ||
| 几 | ji | jī,jǐ | 風,风,凡 | ||
| \偏旁|一畫/ | |||||
| 乛 | yi | yǐ | 乙 | 疋,𠁅,𠧘 | 部首「乙」,非筆畫「橫撇」。 |
| ㇈ | yi | yǐ | 乙 | 九,几,虱 | |
| 亅 | jt | jué | 𠃌,丁,于 | 倒須鈎。標準音[jué]。 | |
| ㇙ | jt | jué | 丩,戉,𱍸 | 反「亅」。標準音[jué]。 | |
| 乚 | hk | háo,yǐ | 七,乙,孔 | ||
| 𠃌 | gp | gǔn | 勹,㔾,力 | 鈎的倒尖。標準音[gǔn]。 | |
| 勹 | bk | bāo | 包 | 包,旬,万 | 古文「包」。對照「𠃌」。 |
| \筆畫/ | |||||
| ㇐ | hg | héng | 一,二,三 | 筆畫:橫。 | |
| ㇀ | ti | tí,tiǎo,cè | 冫,氵,𤣩 | 筆畫:提(挑、策)。 | |
| ㇑ | uu | shù | 丄,丅 | 筆畫:竪。 | |
| ㇒,丿 | px | piě | 人,入 | 筆畫,獨字:撇。 | |
| ㇏ | na | nà | 人,入 | 筆畫:捺。 | |
| ㇔ | dm | diǎn | 亠,心 | 筆畫:點。 | |
| ㇣ | qr | quān | 㔔,㫈,𠆭 | 筆畫:圈。 | |
| ㇖,乛 | yi | yǐ | 疋,冖,宀 | 筆畫,獨字:橫鈎(橫扁撇)。 | |
| ㇁ | gb | gōu,jué | 豕 | 筆畫:彎鈎(彎)。 | |
| ㇂ | jt | jué | 弋,戈 | 筆畫:捺鈎。 | |
| ㇙,𠄌 | jt | jué | 丩 | 筆畫,獨字:竪提(竪挑)。 | |
| ㇚,亅 | jt | jué | 于 | 筆畫,獨字:竪鈎。 | |
| ㇋ | ji | jí | 及 | 筆畫:橫撇橫撇。 | |
| ㇡,𠄎 | nl | nǎi | 乃 | 筆畫,獨字:橫撇橫撇鈎。 | |
| ㇕,𠃍 | ji | jí | 夬 | 筆畫,獨字:橫竪。 | |
| ㇗,𠃊 | yn | yǐn | 甚 | 筆畫,獨字:竪橫。 | |
| ㇘,𠃎 | gb | gōu,gòu | 丱 | 筆畫,獨字:豎彎。 | |
| ㇛,𡿨 | qr | quǎn | 巛 | 筆畫,獨字:撇點。 | |
| ㇜,𠃋 | gs | gōng | 厷,厶 | 筆畫,獨字:撇橫。 | |
| ㇉ | gs | gōng | 弓 | 筆畫:竪橫撇鈎。 | |
| ㇇ | yb | yòu | 又 | 筆畫:橫撇。 | |
| ㇆,𠃌 | gp | gǔn | 又 | 筆畫,獨字:橫竪鈎。 | |
| ㇟,乚 | hk | háo,yǐ | 孔 | 筆畫,獨字:竪曲鈎。 |
附錄二:疑難拆法速查表
收錄高複用率單字疑難拆法、編碼。
下表所列單字,自身未必僻見,而拆法往往疑難。因其複用率高,故常用其最簡拼式(多爲二分拼式)於複合字中。此表主要關注此類單字的最簡拼式。
注:此表並不羅列某字的所有拆法,而是按順序列出最優先拆法的一或多種。
注:某些字首選拆法從單字看未必最優,但從形近字組看是最優選擇(離散化),如「旧由甲申甴曱」之别。
| 單字 | 讀音 | 拆法 | 部件讀音 | 編碼 | 解釋 |
|---|---|---|---|---|---|
| 龍 | lóng | 𦚏 | zhuāng‧lóng | vdls | 留意「𦚏」「」。 |
| 𦚏 | zhuāng | 立⺝ | lì‧ròu | lirb | |
| | lóng | 与乚三 | yǔ‧háo‧sān | yuhksj | 簡易。 |
| 竜 | lóng | 立电 | lì‧diàn | lidm | 留意「电」。 |
| 龙 | lóng | 尤㇒ | yóu‧piě | ybpx | |
| 𣎆 | luò | 吂月凡 | máng‧yuè‧fán | mhytfj | 留意「吂」。 |
| 𣎆 | luò | 亡口月凡 | wáng‧kǒu‧yuè‧fán | whkbytfj | |
| 與 | yǔ,yù,yú | 𦥑与 | jú‧yǔ‧qí | juyuqi | 留意「𦥑」「」。 |
| 興 | xīng | 𦥑同 | jú‧tóng‧qí | jutsqi | |
| 門 | mén | 𠁣𠃛 | jì‧yà | jiya | |
| 鬥 | dòu | 𩰋𩰊 | jú‧jǐ | juji | |
| 行 | xíng,háng | 彳亍 | chì‧chù | iiiu | |
| 龠 | yuè | 亼𠱠𠕁 | jí‧líng‧cóng | jilycs | 留意「亼」「𠕁」。 |
| 僉 | qiān | 亼吅从 | jí‧xuān‧cóng | jixrcs | 留意「吅」。 |
| 惠 | huì | 叀心 | zhuān‧xīn | vrxn | 留意「叀」。 |
| 肙 | yuàn,yuān | 口⺝ | kǒu‧ròu | kbrb | |
| 䏍 | yuàn,yuān | 厶⺝ | sī‧ròu | sirb | |
| 品 | pǐn | 口吅 | kǒu‧xuān | kbxr | |
| 衣 | yī,yì | 亠𧘇 | tóu‧yī | tbyi | |
| 合 | hé,gě | 亼口 | jí‧kǒu | jikb | |
| 命 | mìng | 亼叩 | jí‧kòu | jikb | |
| 令 | lìng,líng | 亽龴 | jí‧máo | jimk | 留意「亽」。 |
| 今 | jīn | 亽㇇ | jí‧yòu | jiyb | |
| 彔 | lù | 彑氺 | jì‧shuǐ | jiuv | 留意「彑」。 |
| 录 | lù | 彑水 | jì‧shuǐ | jiuv | |
| 隶 | lì | ⺕氺 | jì‧shuǐ | jiuv | 留意「⺕」。 |
| 斿 | yóu,liú | 𭤨子 | yǎn‧zǐ | yǎn‧zǐ | 留意「𭤨」。 |
| 旋 | xuán,xuàn | 方𭻾 | fāng‧xuán | fhxr | |
| 旋 | xuán,xuàn | 𭤨疋 | yǎn‧pǐ | yjpi | |
| 象 | xiàng | 𧰨 | xiàng‧gèng | xdgg | 留意「」。,二簡「象」。雖爲二簡,卻有獨特價值。 |
| 免 | miǎn | 儿 | xiàng‧ér | xder | 用「」又一例。 |
| | xiàng | ⺈𫩏 | dāo‧qì | dkqi | 留意「𫩏」。𫩏,二簡「器」。 |
| 豕 | shǐ | ㇐𧰨 | héng‧gèng | hggg | |
| 㒸 | shǐ | 䒑𧰨 | cǎo‧gèng | ckgg | |
| 豖 | shǐ | 豕㇔ | shǐ‧diǎn | uidm | |
| 彖 | shǐ | 彑𧰨 | jì‧gèng | jigg | |
| 氷 | bīng | ㇔水 | diǎn‧shuǐ | dmuv | |
| 冬 | dōng | 夂⺀ | zhǐ‧fù | vifu | |
| 幽 | yōu | 山𢆶 | shān‧yōu | ujyb | 留意「𢆶」。 |
| 幸 | xìng | 土𢆉 | tǔ‧rěn | turf | 留意「𢆉」。 |
| 木 | mù | 十人 | shí‧rén | uirf | |
| 章 | zhāng | 音十 | yīn‧shí | ynui | 字理。 |
| 章 | zhāng | 立早 | lì‧zǎo | lizk | 廣泛接受。 |
| 会 | huì,kuài | 人云 | rén‧yún | rfyp | |
| 死 | sǐ | 歹匕 | dǎi‧bǐ | dlbi | |
| 歨 | bù | 止龰 | zhǐ‧zhǐ | vivi | |
| 龰 | zhǐ,jié,jí | ⺊人 | bǔ‧rén | burf | 留意「⺊」。 |
| 武 | wǔ | 戈止 | gē‧zhǐ | gevi | |
| 或 | huò | 戈 | gē‧dàn | gedj | 留意「」。 |
| 不 | bù,fǒu | 丆卜 | hǎn‧bǔ | hjbu | 留意「丆」。避免用「㇐𡭔」與「朩=㇐小」重碼。 |
| 頁 | yè | 𦣻八 | shǒu‧bā | ubba | 不用「丆貝」以區别於簡形「页=丆贝」。 |
| 页 | yè | 丆贝 | hǎn‧bèi | hjbz | |
| 巨 | jù | 匚コ | fāng‧kuàng | fhkd | 留意「コ」。 |
| 未 | wèi | 木㇐ | mù‧héng | muhg | 字理。 |
| 末 | mò | ㇐木 | héng‧mù | hgmu | 字理。 |
| 本 | běn | 木㇐ | mù‧héng | muhg | 字理。避免用「大十」與「夲=大十」重碼。 |
| 夲 | tāo,běn | 大十 | dà‧shí | daui | |
| 己 | jǐ | コ乚 | kuàng‧háo | kdhk | |
| 已 | yǐ | コ乚 | kuàng‧háo | kdhk | 重碼避無可避,任之。 |
| 巳 | sì | 口乚 | kǒu‧háo | kbhk | 「口乚」避「己已=コ乚」重碼。 |
| 歷 | lì | 厤止 | lì‧zhǐ | livi | 留意「厤」。 |
| 曆 | lì | 厤日 | lì‧rì | liri | |
| 厤 | lì | 厂秝 | chǎng‧lì | ihli | |
| 𠩵 | lì | 厂林 | chǎng‧lín | ihln | |
| 𨸏 | fù | 戶ココ | hù‧kuàng‧kuàng | hukdkd | 留意「戶」。 |
| 𠂤 | duī | 戶コ | hù‧kuàng | hukd | |
| 㠯 | yǐ | 尸コ | shī‧kuàng | uikd | |
| 𢑑 | duō | 𫜹𫜹 | xuě‧xuě | xtxt | 留意「𫜹」。 |
| 𠃓 | yì | ㇐勿 | héng‧wù | hgwu | |
| 𠃓 | yì | 𠄎𰀪 | nǎi‧yì | nlyi | |
| 哥 | gē | 可可 | kě‧kě | keke | 字理。 |
| 戔 | jiān | 戈戈 | gē‧gē | gege | |
| 㦮 | jiān,qián | 戈二 | gē‧èr | geer | |
| 戋 | jiān | 戈㇐ | gē‧héng | gehg | |
| 弋 | yì | 𫠠㇔ | yì‧diǎn | yidm | |
| 𫠠 | yì | ㇐㇂ | héng‧jué | hgjt | 留意「㇂」。 |
| 𭠍 | wù | ㇐㇂㇒ | héng‧jué‧piě | hgjtpx | |
| 巠 | jīng,xíng | ㇐巛工 | héng‧chuān‧gōng | hgirgs | 留意「巛」。 |
| 𢀖 | jīng | ㇇㇔工 | yòu‧diǎn‧gōng | ybdmgs | 留意「㇇」。 |
| 鹿 | lù | 广コ〢比 | guǎng‧kuàng‧xíng‧bǐ | gdkdxybi | 留意「〢」。 |
| 齊 | qí,jì | 亠刀丫𱍸丿二㇑ | tóu‧dāo‧yā‧yī‧piě‧èr‧shù | tbdkyayipxeruu | 留意「𱍸」。 |
| 巟 | huāng | 亡𫶧 | wáng‧chuān | whir | |
| 亡 | wáng,wú | 亠𠃊 | tóu‧yǐn | tbyn | |
| 亡 | wáng,wú | ㇔匸 | diǎn‧xì | dmxi | |
| 𫶧 | chuān,kūn | 儿㇑ | ér‧shù | eruu | |
| 𫶧 | chuān,kūn | 丿㇑乚 | piě‧shù‧háo | pxuuhk | |
| 㠩 | huāng | 亾𫶧 | wáng‧chuān | whir | |
| 川 | chuān | 丿〢 | piě‧xíng | pxxy | |
| 亾 | wáng | 𠃊人 | yǐn‧rén | ynrf | 留意「𠃊」。 |
| 耒 | lěi | 二木 | èr‧mù | ermu | 字理。 |
| 虎 | hǔ | 虍几 | hū‧jī | huji | 陸標。 |
| 虎 | hǔ | 虍儿 | hū‧ér | huji | 兼容臺標。 |
| 午 | wǔ | ㇒干 | piě‧gān | pxgj | |
| 矢 | shǐ | 𠂉大 | wǔ‧dà | wuda | |
| 失 | shī | ㇒夫 | piě‧fū | pxfu | |
| 氏 | shì,zhī | ㇒𠄌𫠠 | piě‧jué‧yì | pxjtyi | |
| 旧 | jiù | ㇑日 | shù‧rì | uuri | |
| 由 | yóu | ㇑曰 | shù‧yuē | uuyt | 不用「日」。 |
| 甲 | jiǎ | 曰㇑ | yuē‧shù | ytuu | 不用「日」。 |
| 申 | shēn | 十囗 | shí‧wéi | uiwz | 不首選「㇑曰」以區分於「由」。 |
| 甴 | zhá,yóu | 丄囗 | shàng‧wéi | uhwz | 留意「丄」。不首選「㇑曰」以區分於「由」。 |
| 曱 | yuē | 囗丅 | wéi‧xià | wzxw | 留意「丅」。不首選「曰㇑」以區分於「甲」。 |
| 方 | fāng | 亠勹 | tóu‧bāo | tbbk | 留意「勹」。 |
| 万 | wàn,mò | ㇐勹 | héng‧bāo | hgbk | |
| 金 | jīn | 全丷 | quán‧bā | qrba | |
| 釒 | jīn | 全丷 | quán‧bā | qrba | |
| 钅 | jīn | 𠂉王 | wǔ‧wáng | wuwh | |
| 食 | shí,sì,yì | 人良 | rén‧liáng | rfld | |
| 飠 | shí,sì,yì | 人良 | rén‧liáng | rfld | |
| 饣 | shí,sì,yì | ⺈㇙ | dāo‧jué | dkjt | |
| 先 | xiān | ⺧儿 | niú‧ér | nqer | |
| 光 | guāng | ⺌兀 | xiǎo‧wù | xcwu | |
| 亞 | yā,yà | 弓弓 | gōng‧gōng | gsgs | 取巧,否則將陷入大量筆畫細節。末「弓」从反。 |
| 亞 | yā,yà | 弓弓 | gōng‧gōng‧ | gsgsfn | |
| 亚 | yā,yà | ㇐业 | héng‧yè | hgye | |
| 凸 | tū | 冂凵 | jiōng‧kǎn | jskj | 簡易。省略連接筆畫,無礙字理。「冂」象高出,「凵」象坎陷。 |
| 凹 | āo,wā | 凵凵 | kǎn‧kǎn | jskj | 簡易。省略連接筆畫,無礙字理。 |
| 亟 | jí,qì | 了叹㇐ | liǎo‧tàn‧héng | lctjhg | 留意「叹」。 |
| 樂 | lè,yuè,yào,lào | 𢆶𣐩 | yōu‧quán | ybqr | 留意「𣐩」。 |
| 乐 | lè,yuè,yào,lào | 𠂆朩 | yì‧mù | yimu | 留意「朩」。 |
| 予 | yǔ,yú | 龴𠄐 | máo‧gè | mkge | 留意「𠄐」。 |
| 禺 | yú,yù,ǒu | 田禸 | tián‧róu | tmrb | 留意「禸」。 |
| 禹 | yǔ | 䖝冂 | chóng‧jiōng | isjs | 留意「䖝」。 |
| 离 | lí | 㐫禸 | xiōng‧róu | xsrb | 留意「㐫」。 |
| 育 | yù,yō | 𠫓⺝ | tū‧ròu | turb | 留意「𠫓」。 |
| 𠫓 | tū | 亠厶 | tóu‧sī | tusi | |
| 𠫓 | tū | 厶㇐ | sī‧héng | sihg | |
| 是 | shì | 日𤴓 | rì‧yǎ | riya | 留意「𤴓」。 |
| 定 | shì | 宀𤴓 | mián‧yǎ | mmya | |
| 胥 | xū | 疋⺝ | pǐ‧ròu | pirb | 留意「疋」。 |
| 契 | qì,qiè,xiè | 㓞大 | qià‧dà | qwda | 留意「㓞」。 |
| 絜 | jié,xié | 㓞糸 | qià‧mì | qwmi | 留意「糸」。 |
附錄三:一點延伸探索
也談「簡繁通打」
所謂「簡繁通打」,目標是在一套方案中讓簡體與繁體都能快速輸出。
做法有兩種:
- 爲簡繁字形賦予不同編碼,允許不切換模式而快速輸出簡繁。這是「分」。
- 讓多數簡繁字形重碼,利用模式切換輸出簡繁。這是「合」。
兩種方式各有短長,無關對錯,只在取捨。
有沒有第三條路?有的,通過適當設計,可以⸺愿合時合,愿分時分。換句話說,旣存在「相同編碼」,也存在「不同編碼」;不需要「模式切換」。
譬如「頂顶」「顁𬱫」。本方案中:
- 合:
dyye(丁頁/定頁/丁页/丁夜/鼎頁/定页/丁也)=頂顁顶𠅗𩕢𬱫𬺼。- 半合:
mmyaye(宀𤴓頁/宀𤴓页)=顁𬱫。hgjtye(㇐亅頁/㇐亅夜/㇐亅也)=頂顶𠅗𬺼。- 半分:
dyubba(丁𦣻八/定𦣻八/鼎𦣻八)=頂顁𩕢。注:有意避免將「頁」拆分作「丆貝」,以區分「页=丆贝」。dyhjbz(丁丆贝/定丆贝)=顶𬱫。mupjpmye(目爿片頁)=𩕢。注:「𩕢」無類推簡「⿰鼎页」,故無「目爿片页」。dyyeof(丁頁Ⓕ/定頁Ⓕ/鼎頁Ⓕ)=頂顁𩕢。注:可選便捷機制「簡繁直取」。dyyeoj(丁页Ⓙ/定页Ⓙ)=顶𬱫。注:可選便捷機制「簡繁直取」。注:「𩕢」無類推簡「⿰鼎页」,故無「鼎页Ⓙ」。- 全分:
hgjtubba(㇐亅𦣻八)=頂。hgjthjbz(㇐亅丆贝)=顶。注:實際應用中輸入至hgjthj卽可單選。mmyaubba(宀𤴓𦣻八)=顁。注:實際應用中輸入至mmyaub卽可單選。mmyahjbz(宀𤴓丆贝)=𬱫。注:實際應用中輸入至mmyahj卽可單選。mupjpmubba(目爿片𦣻八)=𩕢。注:實際應用中輸入至mupjpmub卽可單選。hgjttbrfvidm(㇐亅亠亻夂㇔)=𠅗。注:實際應用中輸入至hgjttbrf卽可單選。hgjtmxuu(㇐亅乜㇑)=𬺼。注:實際應用中輸入至hgjtmx卽可單選。
然而並非本方案刻意設計使然,「分合」的本質早已蘊涵在簡繁字部件自然稟性之中⸺形異音同(如上諸例)或形異音近(典型如「賓宾」)或形異音異(典型如「進进」)。這一本質在大量案例中自然浮現,本方案只是因勢利導,如此而已。
另參考 一點哲學探討|魔然⸺談談「簡繁通打」。
關於「自動擴增」
「自動擴增」是這樣一種内部實現機制:若一個單字存在「二分」拆法(廣泛存在),通過代碼腳本查詢其所有部件的二分拆法,並「擴增」拆分到「三分」;進一步,再「擴增」拆分到「四分」。以此兼顧易用性(二分、三分)與極致單選(四分)。
舉例⸺「語」:
- 二分:訁吾。⸺手工拆分。
- 三分:㊀亠二口吾。㊁訁五口。⸺自動擴增。
- 四分:亠二口五口。⸺自動擴增。
初始「二分」拆解均手工操作或確認,確保質量;擴增「三分」「四分」均通過代碼腳本實現,確保覆蓋率。
額外地,部分字在三分或四分拆解上作人工優化,以作字形兼容(碼同形異,各地標準不同)、容錯(因筆畫密集而誤識)。
數據⸺字符總數: 102369,拆法總數: 550854。單字平均拆法≈5.38。
關於「調頻」
- 不作靜態調頻,字序取碼點序。理由:現代文、古文輸入場景字頻衝突,任意字頻方案均無法兩全。拆法已足够豐富,大多數情況下足以應對「手動調頻」需要(使用過程中,依實際場景所需,變換拆法以實現「手動調頻」)。
- 不作動態調頻。理由:固定字頻,以利於盲打。