[發布]自然全分:檢字法,全字集,高離散,低學習成本

[發布]自然全分:檢字法,全字集,高離散,低學習成本

〇、引言

檢字法,全字集,高離散,低學習成本。

覆蓋漢字基礎區~擴J全部 10,1984 字,以及所有部首、筆畫、結構字符 384 個。共計包含 55,0881 種拆法。

示例:並并幷併竝𠀤。

如上圖,這一組異體字直觀地展示了本方案的特點:

  1. 不強調低重碼。
  2. 強調首選率。
  3. 強調多種拆法覆蓋。
  4. 強調直觀易用。

適用場景

  1. 快速輸入生僻單字⸺不熟悉音義,但清楚字形與部件音義,常規方式難以輸入。面向古文爲主。
  2. 快速輸入異體單字⸺知曉本字、音義、字形,但在主力輸入方案中難以輸入,甚至無法輸入。面向古文爲主。
  3. 快速輸入難檢單字⸺音形義俱熟,但在主力輸入方案中存在大量重碼,檢字花費時間較多。解決大量選重。
  4. 本方案不適合詞、句,詳見下文。

存在形態

  1. 作爲反查單字檢索方案存在(檢字)。適合混合輸入單字、詞句場景,大量詞句、少量單字。需額外一鍵啓動(典型配置使用「`」鍵),但最爲靈活。同類形態舉例:魔然方案掛載反查方式⸺自然兩分(源自葉典網「字海兩分」)、虎碼、倉頡、筆畫、注音符號。
  2. 作爲獨立單字輸入方案存在(打單)。適合補校生僻、異體、難檢字場景,確定只打單。此時專注於此方案下,無需啓動切換。通過少量配置,將此方案掛載爲獨立方案。
  3. 在 rime 輸入平臺下,以上兩種形態可以並存且互不干擾。

本方案志不在取代常規輸入方案,而在互補共存。

🔗下載鏈接

檢字法,全字集,高離散,低學習成本|idsol/zrqf

方案分類

以常規分類而言,輸入方案有三類:音碼、形碼、音形碼。

以用途而言,輸入方案有兩類:打字、檢字。

本方案屬於音形碼檢字法。

本方案以「自然碼雙拼」爲底層編碼機制。

粗略比較:

泛化特徵特點
音碼單字聲韻低離散。長於詞句。
音碼加輔單字聲韻+部件字根輔碼較高離散。長於詞句。*輔碼又分音輔、形輔兩類。
形碼首次三末字根碼低碼長。長於單字。有損拆分。高離散。偏向單拆。
自然兩分首末部件聲韻低碼長。有損拆分。低離散。單拆。
自然全分所有部件聲韻較高碼長。無損拆分。高離散。多拆。

一、動機

引入一種覆蓋面廣(全字集十萬字)、無需記憶字根(以音馭形)、重碼率低(部件全展開)、兼容多種拆字方式(編碼空間足够大,無懼碰撞)、鍵數適中無需記憶編碼規則(不限制碼長)、最大化複用使用者原有知識體系的漢字(單字)輸入方案。

以下詳解:

  1. 覆蓋面廣:首要目標,覆蓋 Unihan 漢字基礎區(字數 20992),擴A~擴J(字數 80992=6592+42720+4160+222+5774+7473+4939+4192+622+4298),額外支持部首區、部首補區、筆畫區、字構區(字數 384=214+116+38+16)(詳見『便捷機制・「部首、筆畫、結構」分類直達』一節)。合計 102368。兼容漢字區永不支持,避免同形異碼混淆。
  2. 无需記憶字根:不將碼元映射到單個按鍵上,而是將碼元映射到用於指稱部件形狀的音節上,每個碼元編碼兩鍵(雙拼自身特性)。(「碼元」等定義詳見「定義」一節。)本方案提供多種拆字方式,以期實現高命中、低選重的目標。所謂「以音馭形」,識音卽知編碼。所謂「寓形於音」,與「音碼形輔」方案類似處,將部件分形離解爲純音碼;與「音碼形輔」方案不同處,爲純輔或先輔後主,可視作「形輔」已離散揉入編碼中(先輔後主詳見「便捷機制・回環直達」一節)。簡言之,「自然全分」與「音碼形輔」方案核心理念均在於將「整體字音」這個壓縮包解壓,而側重點有所不同。
  3. 重碼率低:見下文「吴」「吳呉㕦𠯵」例。最均衡碼長 3(鍵數 6)。
  4. 兼容多種拆字方式:見下文「耒」例「𧵑」例。對任意單字,不局限於一種拆解方式,無需強記一種拆法。因此「自然全分」之「自然」有兩義:㊀以「自然碼」爲基。㊁天然,本然。無論字理拆法、取大優先、取小優先、直觀近似,兼收並蓄。
  5. 鍵數適中:大部分單字鍵數在 4~6 之間。就目標而論,不追求最短鍵數。就實效而言,大量常用字在 4 鍵「首次三」選;6 鍵編碼幾乎全部零選重。
  6. 無需記憶編碼規則:不限制碼長,意味着無需複雜編碼規則(例如限制單字鍵數最大爲四、不同首尾形取法等),同時也意味着能够精確描述所有複雜合字。舉例:「贏」字形近組「嬴𫢃蠃𫢄𦣄𥢵𦣖䇔𨏩驘𦆁⋯」,常規拆分「亡口月*凡」(鍵長 10)(𦆁=亡口月糸凡=whkbytmifj),進階拆分「吂月*凡」(鍵長 8)(𦆁=吂月糸凡=mhytmifj),兩元拆分「𣎆*」(鍵長 4)(𦆁=𦆁糸=lomi),均支持。使用者儘可盲拆,未命中不是使用者的問題,而是本方案未能盡善之故。因此,「自然全分」之「全分」有兩義:㊀單字完全拆分,而非部分。㊁多種拆字方式,儘可能覆蓋合理舒適度範圍之内的全部排列組合。
  7. 最大化複用使用者原有知識體系:㊀無需識别單字讀音,識别其組成部件讀音卽可。㊁每個單字平均存在五種拆法,絕大多數字至少有一種拆法拆至常見單字、部首、筆畫範疇。㊂拆法以字理拆法托底,但不避忌字理之外拆法,不避忌交叉拆分,以高命中率爲要。㊃前文已及,無需記憶字根、無需記憶編碼規則。㊄完全繼承已有拼讀體系(以漢語拼音方案爲準)。㊅以自然碼雙拼爲編碼基礎,對全拼使用者雖有一定阻礙,但只有兩位數「聲韻-按鍵」映射需記憶條反(確切地說,是 30 個聲韻,且其中占絕對多數的 21 個聲韻是一一映射),顯著低於多數形碼的三位數字根數量。㊆若使用者已有自然碼雙拼方案使用經驗,則毫無學習成本。㊇其他雙拼方案使用者,則需要適應。如小鶴雙拼方案、微軟雙拼方案等。

「吴」「吳呉㕦𠯵」例

以「吴」字及其異體「吳呉㕦𠯵」爲例。首要考察重碼率。

  • 吴=口天=kǒu‧tiān=kbtm。碼長 2(鍵數 4)、重碼 32。首選。
    • 吴=口㇐大=kǒu‧héng‧dà=kbhgda。碼長 3(鍵數 6)、重碼 10。首選。
    • 吴=口天吴(回環)=kǒu‧tiān‧wú=kbtmwu。碼長 3(鍵數 6)、重碼 1。首選。
  • 吳=口𠃑大=kǒu‧yǐn‧dà=kbynda。碼長 3(鍵數 6)、重碼 1。首選。
  • 呉=口𠃑𬺢=kǒu‧yǐn‧qí=kbynqi。碼長 3(鍵數 6)、重碼 0。單選。
  • 㕦=口大=kǒu‧dà=kbda。碼長 2(鍵數 4)、重碼 46。第五。
    • 㕦=口㇐人=kǒu‧héng‧rén=kbhgrf。碼長 3(鍵數 6)、重碼 14。首選。
    • 㕦=口大㕦(回環)=kǒu‧dà‧huà=kbdahw。碼長 3(鍵數 6)、重碼 0。單選。
  • 𠯵=口𠃍𬺢=kǒu‧jí‧qí=kbjiqi。碼長 3(鍵數 6)、重碼 0。單選。

「耒」例

以「耒」爲例。首要考察拆字靈活度。

  • 耒=二木=èr‧mù=ermu。字理。《說文》:「耒,手耕曲木。从木推丯」。隸定變「丯」爲「二」。
  • 耒=丯木=jiè‧mù=jxmu。字理,上溯篆形。《說文》:「丯,象艸生之𢿱亂也」。
  • 耒=丰人=fēng‧rén=fgrf。取大優先。
  • 耒=㇐未=héng‧wèi=hgwz。取小優先。
  • 耒=末㇐=mò‧héng=mohg。直觀近似。
  • 耒=三𡭔=sān‧xiǎo=sjxc。直觀近似。

「𧵑」例

以「𧵑」爲例。首要考察拆字靈活度。

  • 𧵑=貝古=bèi‧gǔ=bzgu。兩分。碼長 2(鍵數 4)、重碼 6。首選。
  • 𧵑=貝十口=bèi‧shí‧kǒu=bzuikb。三分。碼長 3(鍵數 6)、重碼 1。單選。
  • 𧵑=目八古=mù‧bā‧gǔ=mubagu。三分。碼長 3(鍵數 6)、重碼 3。首選。
  • 𧵑=目八十口=mù‧bā‧shí‧kǒu=mubauikb。四分。碼長 4(鍵數 8)、重碼 0。單選。

附「游遊𫹛䑻蝣𩘓𩹊」例。

  • 游=氵斿=shuǐ‧yóu=uvyb。兩分。
  • 游=氵𭤨子=shuǐ‧yǎn‧zǐ=uvyjzi。三分。
  • 游=氵方𠂉子=shuǐ‧fāng‧wǔ‧zǐ=uvfhrfzi。四分。額外考慮「𭤨」字生僻程度。

「遊𫹛䑻蝣𩘓𩹊」類推不贅。

二、便捷機制

便捷機制是指「常規編碼」之外的「特殊編碼」。這些「特殊編碼」都是「常規編碼」之外的可選編碼,並不強制使用,但若熟練掌握,有事半功倍之效。如下所示:

  1. 倍碼縮寫。後綴編碼 b*(利用雙拼空碼 bqwertvb),表達某一部件重複 ⑶~⑼ 次。主要目的是壓縮碼長
  • 注:首創機制。
  • 注:b 取義「倍」(bèi)。例:ybbqybybyb=又×3=又⑶=叒,ybbw=ybybybyb=又×4=又⑷=叕,以此類推。極限壓縮示例:𧆘=艹囗木木木木木木木木木=ckwzmumumumumumumumumu;𧆘=艹囗木×9=艹囗木⑼=ckwzmubb。又如:𡦪=子子子子子子=zizizizizizi;𡦪=子×6=子⑹=zibr
  • 又注:助記符 b(倍),遇「叒」,心流讀若「又倍三」,自鍵盤字母區左上角 qwert 依次映射 345673q,故快速組合取 bq。此處空碼組合選取有意爲之,便於記憶。重複次數取範圍 ⑶~⑼,因 ⑶ 以下無壓縮效果,且 ⑼ 以上部件重複在漢字中不存在 。
  • 補注:倍碼也可附加在複數碼元之後,用於描述多個部件作爲一個整體重複多次,且無需特殊表達(譬如增加括號或變換順序之類),串流打出卽可。例:𨽰=阝山人儿山人儿山人儿=阝山人儿×3=fuujrferbq,其中「山人儿」三個部件作爲一個整體重複三次,只需將「bq」簡單附加在整體之後,無需特殊表達(向上「阝㞤儿×3=fuynerbq」同理,再向上「㞤儿」則不成獨字)。
  • 補例:「又双(㕛)叒叕」[yòu‧shuāng‧(yǒu)‧ruò‧zhuó]。「火炎(炏)焱(𲫭)(㷋)燚」[huǒ‧yán‧(yán)‧yàn‧(fán)‧(tán)‧yì]。「日昍晶」[rì‧xuān‧jīng]。「口吅(吕)品㗊𠾅」[kǒu‧xuān‧(lǚ)‧pǐn‧jí‧yín]。「子孖孨(𡥦)𡦪」[zǐ‧mā‧zhuǎn‧(nǐ)‧jí]。
  • 結構識别。後綴編碼 f*(利用雙拼空碼 fqwertnmx),表達漢字結構 ⿰⿱⿴⿵⿸⿾⿿㇯。主要目的是快速去重
    • 注:靈感源自「王碼五筆」「結構識别碼」。
    • 注:f 取義「分」(fēn)。例:dadafq=大大⿰=夶,dadafw=大大⿱=㚐,以此類推。
    • 又注:注意 f 之後 * 亦是 qwert 起始。空碼組合特意取與 b* 相仿。助記符 f(分),遇「夶」(大大⿰),心流讀若「大大分左右」,故組合取 fq
    • 尾注:⿰⿱⿴⿵⿸⿾⿿㇯,分别解讀⸺⿰:左右;⿱:上下;⿴:全包圍;⿵:三包圍(聚合並代表⿵⿶⿷⿼);⿸:兩包圍(聚合並代表⿸⿺⿹⿽);⿾:左右鏡像;⿿:上下鏡像;㇯:移除部件。
    • 附注:從實用角度出發,本方案實際編碼中以「⿰⿱⿾⿿㇯」爲主,這是爲了避免因過度分析化而導致打斷心流。
    • 注:「㇯」例:「𣱱=水㇯㇐=uvfxhg」。
    • 注:「㇯」是惟一例外的中綴編碼,因爲這樣理解起來更自然。試比較:「𩤷=馬亞㇐㇯=mayahgfx」(廢案)與「𩤷=馬亞㇯㇐=mayafxhg」(定案)。
  • 回環直達。模式=拆分部件+本字,用以從獨字、合字、易混字候選列表中快速篩選高價值獨字。以尾部附加兩鍵的可選代價,避免或減少選重,故稱直達。主要目的是快速去重。所謂「高價值」獨字,標準有二:㊀高頻/常用。㊁在其他方案或本方案中存在較多重選。
    • 注:靈感源自「自然兩分」。「自然兩分」中有零星見例,本方案將此擴展應用至 1800+ 字。
    • 例:雨隹霍=yuvvho=霍[huò]。羽隹翟=yuvvdi=翟[dí,zhái]。羽隹𦑏=yuvvil=𦑏[chài]。
  • 「部首、筆畫、結構」分類直達。此三類「字符」僅適用於文字學分析場景,不適合日常書寫場景,因此獨立分類,不混入常規「單字」中,且使用「前綴+簡拼」模式。部首編碼「bs*」,筆畫編碼「bh*」,結構編碼「jg*」。
    • 注:靈感源自「魔然」方案中「pp」前綴引導「偏旁」編碼。
    • ㊀前綴爲相應分類簡拼。
    • ㊁打出前綴卽可得相應分類下所有字符。
    • ㊂若需直達某字符,則續打出相應稱呼簡拼(有例外,見後)。例:jgzy=結構左右=「⿰」、jgjxzy=結構鏡像左右=「⿾」。bhwg=筆畫臥勾=「㇃」、bhph=筆畫撇橫=「㇜」。bsuv=部首水=「⽔⺡⺢」次選「⺡」。(注:部首因其數量衆多⸺330 個,所以同時適用簡拼、雙拼、乃至雙拼帶單輔碼。例如 bsu 有 33 候選,略過不提。bsuv 已見前文,3 候選。bsuvd=「⺡⺢」首選「⺡」,輔碼規則與自然碼輔碼方案同。)
    • ㊃其中「bs」自身爲稀疏碼,在常規自然碼雙拼方案中僅對應一字「𮵕」,在本方案中對應零字(不參與組字)。「bh」自身爲稀疏碼,在本方案中僅對應四字「𮫠帮幚𫑢」。「jg」自身爲空碼。
    • ㊄稱呼清單數百,恕不完整列出。使用者可自行猜測/嘗試,或依靠 rime 反查方案中前綴打出後候選列表中可見的後續編碼提示。
  • 内置飛鍵。所謂「飛鍵」就是給一些難打的雙拼組合一個新的打法。參考自「魔然」方案。現有三組(qxqoxqxowzwk)。完全可選,原組合 qxxqwk 仍可用。qoxowk 本是空碼,屬回收再利用。
  • 簡繁直取。利用空碼 ojof 後綴編碼,分别指定「簡繁」(ⒿⒻ)。例:「嵸𡵝」「嵷𰎌」=「山從」「山从」=ujcs。「𡵝𰎌」=ujcsoj,「嵸嵷」=ujcsof
    • 注:首創機制。
    • 可與「結構識别」結合。如:「𡵝=山从⿱Ⓙ=shān‧cóng‧⿱‧Ⓙ」=ujcsfwoj(縱簡),「𰎌=山从⿰Ⓙ=shān‧cóng‧⿰‧Ⓙ」=ujcsfqoj(橫簡),「嵸=山從⿱Ⓕ=shān‧cóng‧⿱‧Ⓕ」=ujcsfwof(縱繁),「嵷=山從⿰Ⓕ=shān‧cóng‧⿰‧Ⓕ」=ujcsfqof(橫繁)。
    • 可與「回環直達」結合。如:「𡵝=山从𡵝Ⓙ=shān‧cóng‧zōng‧Ⓙ」=ujcszsoj(zōng簡),「𰎌=山从𰎌Ⓙ=shān‧cóng‧sǒng‧Ⓙ」=ujcsssoj(sǒng簡),「嵸=山從嵸Ⓕ=shān‧cóng‧zōng‧Ⓕ」=ujcsssof(zōng繁),「嵷=山從嵷Ⓕ=shān‧cóng‧sǒng‧Ⓕ」=ujcsssof(sǒng繁)。
    • 類似的還有:責责,斬斩,軍军。

    三、編碼空間

    以漢語拼音有效音節爲碼元,數量爲 405。

    兩碼元編碼空間=405²=16ˍ4025。簡稱「兩元四鍵」。重碼較多,但對於少量字,仍能首選或零重。

    三碼元編碼空間=405³=6643ˍ0125。簡稱「三元六鍵」。重碼較少,最實用的碼長。

    四碼元編碼空間=405⁴=269ˍ0420ˍ0625。簡稱「四元八鍵」。重碼極少,較少使用。

    四、定義

    • 碼元:編碼單元。在本方案中,編碼單元爲任意漢字部件,包括:獨字、偏旁、部首、筆畫。例:獨字「手」、偏旁「扌」、部首「龵」、筆畫「㇐亅㇀」[héng‧jué‧tí]。
    • 碼長:碼元長度。每個碼元取其無調拼音,編碼爲雙拼;按部件順序依次編碼;不限制最終編碼的長度。
    • 鍵數:按鍵數量。按鍵數量=碼長×2。
    • 碼序:部件編碼順序。基本原則有三:㊀先上後下/先左後右。不強求與筆順相同。㊁包圍結構,先框架、後内容,優先級高於原則㈠。如「襵=衤聶=衤耳聑=衤耳耳耳=衤耳×3」(應用原則㈠)。如「山=凵㇑」(而非「㇑凵」)(應用原則㈡)。「武=戈止」(原則㈠㈡皆符合,且字中「㇐弋」實爲「戈」變體)。「哉=𢦏口=十戈口」(而非「戈十口」)(此處融合應用兩條原則且不牴觸,「戈」只包圍左下空間,否則恐怕要叫做「中央包圍地方」)。如「亾=𠃊人」(而非「人𠃊」)(應用原則㈡)。㊂内容超出框架,則先内容、後框架。
    • 重碼:任一編碼的重複單字數量。固定減一,卽某編碼若僅包含一個候選,則重碼=0。
    • 單字:待編碼字。區别於用作漢字部件的「獨字」。
    • 部件:組成單字的基本單元。包括:獨字、偏旁、部首、筆畫。
    • 獨字:旣可作單字,亦可作部件。
    • 偏旁:合體字的構字部件。古稱左部部件作「偏」,右部部件作「旁」,現統稱「偏旁」。分「表義形旁」與「表音聲旁」兩類。
    • 部首:特指表義偏旁,卽「形旁」。常規部首 214 個,擴展部首 116 個。又分「識字部首」與「檢字部首」兩類。
    • 筆畫:38 個。筆畫均有稱呼,但並非都有單音節讀音,故只取其中一部分作構字編碼之用。典型如:「㇐㇑㇒㇏㇔㇣」(héng‧shù‧piě‧nà‧diǎn‧quān)。特别地,本方案在使用以上筆畫時,均不使用獨字「一丨丿乀丶〇」(yī‧gǔn‧piě‧fú‧zhǔ‧líng)作替代,特此說明。(但其中獨字「丿」仍間或使用,讀音與筆畫「㇒」相同,不影響最終結果。僅爲中間産物精確描述字形計。)
    • 兩分:將單字完整拆分爲兩個碼元(部件)。「三分」「四分」以此類推。
    • 拼式:單字拼合方式。與拆法一體兩面。拆法描述從單字到部件,拼式描述從部件到單字。

    五、實例

    實例主要用於瞭解拆字思路、基本原則。

    1. 優先拆作獨字,其次偏旁部首,最次筆畫。可知基本原則爲逐級「自頂向下」,而非「自下而上」、用「有限字根」去匹配「近乎無限組合」。
    2. 部件存在多個拆分層級時,均作支持,卽使較高層級存在較高重碼率。較高層級拆分重碼率高、易用性高、易識别性低。較低層級重碼率低、易用性低、易識别性高。換句話說,不避重碼。對單個字來說,由於支持多種拆解方式,卽使某種拆法重碼多,在另一種拆法中也可能零重碼。易知設計哲學是「舒適度優先」,讓使用者多種拆法都能命中,打得出;其次使用者通過深入使用,自然能找到舒適度與重碼率兼顧的最優拆法。
    3. 不無限拆分。首先兩分拆解廣泛存在(易用性最高),其次主要覆蓋三分拆解(重碼率與易用性最均衡),再次覆蓋四分拆解(重碼率最低)。而少量無法兩分、三分、四分的複雜合字,則任其自然。
    4. 部件取音原則,優先標準音,其次儘量離散。如「」[rén]、「𠂉」[wǔ]之分(而非歸并到「人」[rén]),「」[jiōng]、「」[kǎn]、「」[fāng]、「」[kuàng]之分(而非歸并到「框」[kuàng]),「」[kǒu]、「」[wéi]之分(而非歸并到「口」[kǒu]),「」[yuè]、「⺝𱼀⺼」[ròu]之分(而非歸并到「月」[yuè]。一般規律是,部件在左通常爲[yuè],在右/下通常爲[ròu])。「糹纟」[sī]、「」[mì,sī]之分(而非歸并到[sī]或[mì])。
    5. 取音原則中,存在少量例外。例如不區分「」[fù](阜)(左包耳)、「」[yì](邑)(右包耳),歸并作「阝」[fù](左包耳),並非識别或認同上的考量,而是[yì]這個音節在部件之中大量存在,屬於「熱區」,處於離散度考慮,予以避免。又如「」[zhì]、「」[suī]歸并作「夂」[zhì](「夊」僅有少量認定使用,數量不過百,「夂」則在千數),則是識别難度的考量,字形差異過小(獨字已難區分,何況兩者多在下部,加劇了識别難度);一是使用者難以目視區分,二是各地區標準不一、同一碼位單字字形往往不同,三是不同字體廠家又有不同程度的舛誤;與此形近的「」[pū]則如常,通常在右部而較易識别,且訛誤較少;「」[wén]亦如常。其餘詳見「附錄:部件編碼速查表」一節(此表只收「生僻、多音、易混」部件)。
    6. 部件需要有音,無音部件不作選取(不強行定音)。這意味着從源頭避免使用大量存在的喃字、K源字、J源字、T源戶政字作部件,從而讓使用者不必爲這些字的(人爲、非標、無法)定音糾結。

    「𢌋」例

    𢌋,同「廡」[wǔ]。「廡」字依然生僻?組詞「廊廡」,大致能揣測字義。

    代表一類字,單字、部件均生僻

    「𢌋」字如何拆分?「广」「大」清晰無誤,通過簡化字思路,合作「庆」。下部「𣚨」字生僻。再拆「𣏼𣏼」,仍然生僻。再拆「廿木廿木」。

    如此一來,有三種拆法:

    1. 庆𣚨=qìng‧wú=qywu。(有重碼 21,其中首選「毒」兼容臺標字形「龶毋=qywu」)
    2. 庆𣏼𣏼=qìng‧huá‧huá=qyhwhw。(重碼 0)
    3. 庆廿木廿木=qìng‧niàn‧mù‧niàn‧mù=qynmmunmmu。(重碼 0)

    三種拆法均作支持,兼容不同熟悉程度。

    「丅十𠃍、丄𠃊𠃎」例

    對音碼方案或音主形輔方案而言,筆畫越少的字,通常有越難檢索的趨勢。在本方案中,這不是問題。

    輸入 hguu,指稱筆畫「㇐㇑」(héng‧shù),第一二三候選依次爲:「丅十𠃍」(xià‧shí‧jí)。若希望快速去重,利用可選「回環直達」機制(詳見「便捷機制」一節),尾部附加本字碼元,如「𠃍」=hguuji,可將「𠃍」推至首選。

    輸入 uuhg,指稱筆畫「㇑㇐」(shù‧héng),第一二三候選依次爲:「丄𠃊𠃎」(shàng‧yǐn‧gōu)。

    「吕、吅」例

    代表一類字,卽字内包含相同部件,且字間具備不同結構

    常規編碼,吕=吅=口口=kbkb,需選重。

    可選「結構識别」機制下(詳見「便捷機制・結構識别」一節),吕=口口⿱=kbkbfw,吅=口口⿰=kbkbfq

    注:所有此類含且僅含相同部件的單字,均已應用該機制。

    「群、羣」例

    代表一類字,卽字内包含不同部件,且字間具備不同結構

    常規編碼,群=羣=君羊=jpyh,需選重。

    可選「結構識别」機制下(詳見「便捷機制・結構識别」一節),群=君羊⿰=jpyhfq,羣=君羊⿱=jpyhfw

    注:此類單字,僅部分應用該機制,並不全體應用(主要是工作量問題)。

    「衍、聞、裏、贏、斑、辦、鬭、㱿」例

    代表一類字,特殊複合獨字中置其他部件

    =彳亍[chì‧chù]。衍=行氵=彳氵亍。注:「彳」,小步。「亍」,步止。合爲「行」走。

    =𠁣𠃛[jì‧yà]。聞=門耳=𠁣耳𠃛。注:「𠁣」,門左。「𠃛」,門右。合爲「門」戶。「𠁣𠃛」象開關門聲。

    =亠𧘇[tóu‧yī]。裏=衣里=亠里𧘇。注:「亠」,《字彙》:「徒鉤切,音頭。義闕」。「𧘇」,漢字部件,「衣表」下部。喃字。無音,取「衣」。

    𣎆=吂月凡=亡口月凡。贏=𣎆貝=吂月貝凡=亡口月貝凡。注:「𣎆」[luò],獸名,象形。「吂」[máng],默然,遲鈍。

    =王王。斑=玨文=王文王。班=玨𬼀=王𬼀王。注:「玨」[jué],同「𤤴」「珏」。注:「𬼀」[wéi],J源,同「為」。借形作部件。

    =辛辛。辦=辡力=辛力辛。辨=辡𬼀=辛𬼀辛。注:「辡」[biàn],「辯」之初文。

    =𩰋𩰊[jú‧jǐ]。鬭=鬥斲=𩰋斲𩰊。鬪=鬥𭔰=𩰋𭔰𩰊。

    㱿=𣪊=𡉉殳[què‧shū]=𡉉几又[què‧jī‧yòu]。𣪺=𣪊糸=𡉉糸殳。注:「㱿」(𣪊)[què,hù,qiǎng]。《說文》:「㱿,从上擊下。从殳𡉉聲。」

    「𢀓、𠆭、𦮙」例

    代表一類字,卽包含特殊筆畫

    𢀓,T、J 源,同「巨」。如何表達?⸺「工㇣㇣」(gōng‧quān‧quān)(其中筆畫「㇣」〔quān〕在某些字體中視覺上接近數字「〇」〔líng〕),編碼 gsqrqr

    𠆭,G、T、J 源,同古文「𩃬」(陰,侌)。拆分「亼㇐㇣」(jí‧héng‧quān),編碼 jihgqr。字理拆分「今云」(jīn‧yún、同「侌」),編碼 jnyp

    𦮙,T、J 源,同「葵」。拆分「艹屮屮屮屮」(cǎo‧chè‧chè‧chè‧chè),其中四個「屮」部件各以不同角度旋轉,不作特殊表達,編碼 ckieieieie。利用可選「倍碼縮寫」機制(詳見「便捷機制・倍碼縮寫」一節),則表達爲「艹屮×4」或「艹屮倍四」,編碼 ckiebw

    六、致謝

    七、後編

    本方案啓動於 2025 年 4 月中,完成於 2026 年 5 月初。

    爲確保質量,全程堅持手工拆解,謹慎使用現存公開數據(有大量修正),不使用爬蟲爬取數據(僅手動查詢音形義且交叉比對),不使用自動拆分工具(例如 汉字自动拆分系统|chaifen.app)。在完善過程中,自舉程度越來越高,並順帶完成大量測試與糾錯。

    我享受這個過程,希望作爲使用者的你,也享受使用過程。

    附錄一:部件編碼速查表

    用於速查生僻、多音、易混部件的編碼、讀音

    注:下表中多音部件列出所有(或至少大部分)讀音,而統一取用首個讀音作編碼。讀音順序確定原則爲義項多寡爲主、義項通用程度爲輔。

    注:下表「解釋」列中文字提及「通用」「覆蓋」者,一般指拆字過程中優先認定並使用前者,較少使用後者。前者大多在輸入時通行無礙,後者則在部分字中可選可用。

    注:排序首先按筆畫數倒序,異於字典部首檢字序,同於本方案自頂而下觀(從趣味性上說,筆畫過於無趣,也應該放在最末)。其次按起筆「㇐㇑㇒㇏㇔㇣」排序,大致同於部首檢字序。再次按相關性分組,允許不同筆畫數部件相鄰,標記以「對照」。

    部件編碼讀音認同見例解釋
    \獨字|十七畫/
    ytyuè籥,鑰
    \獨字|十二畫/
    iichǐ噛,齢,𫠚
    齿iichǐ啮,龀,龁對照「齒」。
    mnmǐn,miǎn,méng,měng僶,澠,竃
    mnmǐn,miǎn,méng,měng渑,绳,蝇
    vizhǐ黺,黻,黼
    \獨字|十一畫/
    qmqián,gān
    lu鹹,塷,滷
    𱕻wzwèi鹵,𠷝,𠿥
    𠂭mimǐ,bì鹵,𠚍,鬯
    𠚍ihchàng𠚍,鬯
    ihchàng鬰,𡏓,𥠴古文「暢」。
    gvguī,jūn,qiū穐,䆴,䦰
    gvguī,jūn,qiū阄,𫃧,𫜳
    \獨字|十畫/
    bcbiāo髮,鬢,鬚「彡」見後。
    ihcháng髟,𨲊,𨲜「長」之變體。
    dbdòu對照「𩰋𩰊」。
    𩰋ju𠨭鬥,鬬,鬪持。
    𩰊ji鬥,鬬,鬪握持。
    𠨭ju𩰋持。零見例。轉「𩰋」。
    ji𩰊𨑽,𤜾握持。
    lslóng槞,滝,篭
    lslóng厐,咙,垄
    \獨字|九畫/
    wzwéi偉,韍後簡作「韦」。
    𭇁wuwú,yù「韋」之上部。
    𫝀wu𭇁「𭇁」之上部。
    kwkuà對照「韋」「舛」。
    irchuǎn對照「㐄」。相背。錯誤。
    \獨字|八畫/
    qyqīng「青」之變體。
    yryuán靑,𮃇「靑」之下部。見例個位數。
    vvzhuī,cuī,wéi雀,雁,誰總稱「鳥」。
    qiqí,jì,zī,zhāi剤,済,㑪
    qiqí,jì,zī,zhāi侪,剂,挤
    \獨字|七畫/
    𦣻ubshǒu,bǎi首,(百)頁,夏
    ubshǒu𡭎,䭬,𡭑對照「𦣻」。
    uishǐ豕,逐公豬。
    svsuì隊,遂對照「豕」[shǐ]。「遂」之初文。
    vizhì,zhài貓,貌對照「𧰨」[gèng]。嘼。蟲。
    𧰨gggèng對照「豕」[shǐ]。《海篇》「古嶝切,音艮。聚也。」
    ynyín對照「𧰨」[gèng]「㐺」[yín,zhòng]。「㐺」之變體。衆立貌。又「衆」之省變體。
    ynyín,zhòng對照「乑」[yín]。衆立貌。又「衆」[zhòng]之初文。
    𫡑ynyín,zhòng對照「㐺」[yín,zhòng]。衆立貌。「㐺」之變體。又「眾」[zhòng]之省變體。
    vszhòng⿱日㐺商甲骨上部从「日」,周金文訛變作「目」,秦漢篆隸訛作「罒」,楷化訛變作「血、罒」。大陸以此爲正。
    vszhòng⿱日㐺商甲骨上部从「日」,周金文訛變作「目」,秦漢篆隸訛作「罒」,楷化訛變作「血、罒」。臺灣以此爲正。
    vszhòng衆,眾「衆眾」之近古省變體、簡體。
    𰁧cscóng,zòng類推簡「從」。與「㐺」[yín,zhòng]音義大異。
    mkmào「貌」之初文。
    mi芈,哶,蝆
    gfchóng風,𧔗古文「虫」。
    \獨字|六畫/
    lzlěi耒,耜農具。
    jmjiān「筓」[jī]之初文。
    西xi覀,襾要,覃覆蓋「襾」「覀」。
    yayà,xī要,覃通用「西」。
    yayà,xī要,覃通用「西」。
    ykyǎo即,既「即既」左部巖式認定。
    jijí,bī卽,旣「卽旣」左部巖式認定。
    gfgèn,gěn良,即,既「即既」左部寬式認定。
    ji旣,既對照「㫐」「皀」。
    gfgèn,gěn虎,𧆞,䖈虎紋。
    hvhuí
    hvhuí𠄢對照「囬」。
    ckcǎo芔,𠔖,𨴔百草。「草」之本字。
    iechè,cǎo艸,出,㞢象草木初生。
    ckcǎo草,荅,䒢對照「艸」。
    grguàn,kuàng𦍋,㐀「丱」之變體。對照「艹」。
    grguàn,kuàng象幼童束髮如角貌,總角。對照「卝」。
    xsxiōng兇,䣴,𧵮
    xsxiōng離,离對照「兇」。
    jqjiù臼,𡘑下橫封口。
    𦥑jujú,jǔ,póu與,興,輿下橫開口。對照「臼」。
    bmbiàn(番),(播)辨别,象獸爪分别。一說會翻土播種之意。「番」之初文。「播」之初文。與「采」[cǎi](爫木)異,「釆」=「㇒米」。
    clcǎi,cài从爪(爫)从木,會意摘取。
    yu聿,筆「筆」之初文。
    yu聿,筆「聿」之省體。
    yu「聿」之變體。
    \獨字|五畫/
    𣄼hphūn昏,昬近古造字。从倒「旦」,會意,「日」在「㇐」(地)下。
    djdàn上古字。對照「𣄼」。
    𠮛vizhǐ近古省變體,上從「匕」省,下從「日」省。
    𬺣djdàn近古省變體,上從「日」省。對照「旦」。
    pipǐ,yǎ,shū胥,蛋
    𤴔uushū,pǐ,yǎ對照「疋」。
    𤴓ya對照「疋」。
    \獨字|四畫/
    wu勿,無𩬍,毎,毐作偏旁時,中竪多不出頭。惟「毐」例外。
    grguàn貫,𪞈右下作竪,不作勾。對照「毋」。
    pjpán,qiāng牀,壯,狀
    pjpán,qiāng壮,状對照「爿」。
    ubshǒu看,拜
    ubshǒu搭,找對照「龵」。
    uushū殳,役
    rbróu厹,蹂禺,离
    rbróu禸,蹂𣓕,𣽕對照「禸」。
    gyguài,jué
    \獨字|三畫/
    𡭔xcxiǎo少,雀,尖「小」之變體。
    xcxiǎo肖,当,𭕆「小」字頭。
    𭕄,⺍xtxué「⺌」之變體。作「学」字頭。
    xnxīn心,忄𠇍,𢛩
    \獨字|二畫/
    𠂆yi虒,𠂋,后與「厂」[chǎng,hǎn,ān]異。
    𰀪yi𠂆,抴勿,𠃓,彡兩「㇒」[piě]。
    ujshān,xiǎn彩,杉,彣三「㇒」[piě]。
    丿pxpiě右戾也。象左引之形。同筆畫「㇒」。
    \偏旁|八畫/
    uishí
    uishí
    uishí對照「飠」。
    \偏旁|七畫/
    iochuò𫐳,𡿽
    iochuò達,巡覆蓋「⻍」「⻎」。
    iochuò達,巡字形異。通用「辶」
    iochuò達,巡字形異。通用「辶」
    zu踢,蹕
    ynyǐn,yìn建,延
    \偏旁|六畫/
    𠕋ce冊,册𠱡,𨀢
    𠕁cscóng龠,扁義「孔」。對照「𠕋」。
    𥫗vuzhú答,篇
    sisī,mì絲,䋪「糸」之變體。
    sisī,mì绂,纰「糹」之草變體、簡體。
    mimì,sī糸,絲「糹」之初文。取古音以示位置有别(多在下/右)。
    𦍌yhyáng,xiáng,rèn義,羲「羊」在上部之變體。
    yhyáng差,着「羊」在上部之變體。
    \偏旁|五畫/
    𠁣ji
    𠃛ya對照「𠁣」。
    mfmén閒,閑,間對照「𠁣𠃛」。
    whwǎng𡶩,罷
    whwǎng罕,𦉲,𦊅對照「罒」。
    whwǎng𡵠,𢌺對照「罒」。
    𠕀whwǎng𢁶,𩖩,𫙑對照「罒」。
    𦉫whwǎng,rén而,𦊉對照「罒」。
    ytyuè,ròu月,肉刖,朕,明「肉」源别見獨字「𱼀」、部首「⺝⺼」。
    𱼀rbròu,yuè然,祭,豋多在上。
    rbròu肙,䏍多在右或下。
    rbròu胐,脁多在左。
    mkmào帽,冒,冐「帽」之初文。區别「日曰」。
    nenè,bìng病,痾
    \偏旁|四畫/
    qyqīng青,𫠤,𭃌,毒部件「青字頭」,音取「青」。
    lklǎo老,考
    nqniú牛,牜告,先,𭇆「牛」作上下偏旁之變體。僅「告」等三例。
    nqniú牛,⺧牝,牡「牛」作左側偏旁之變體。
    vkzhǎo,zhuǎ寽,䍃
    hohuǒ,biāo然,魚,麃「biāo」音僅見《集韻》《類篇》。
    uishì祀,禮
    yi襖,襬對照「礻」。
    \偏旁|三畫/
    wzwéi,guó圍,國圍,國,国,囯古文「圍」。古文「國」。部件「外包圍」。
    ji下橫出頭(部分字體字形錯誤)。
    ji中橫出頭(部分字體字形錯誤)。
    𫜹xtxuě(雪)三橫等長。壯字,用同「雪」。同「雪」,二簡字。
    𰀂ntnüè(虐)中橫出頭。同「虐」,二簡字。
    𰀄ntnüè(虐)三橫等長。同「𰀂」。
    gsgǒng弁,戒,开
    yi戈,代
    𫠠yi弋,氏對照「弋」。
    whwāng,yóu尤,尬,𡯥
    whwāng𧉇,尦,𫵒對照「尢」。
    𡯂whwāng𡰇(臺標)「尣」之臺標字形。對照「尢」。
    iichì行,衍
    iuchù行,𠼫對照「彳」。
    xyxíng,háng,hàng,héng䘖,衏,衐對照「彳亍」。
    irchuān,shùn巡,巠
    𫶧irchuān,shùn㐬,巟
    qrquǎn𤟉,獓
    vizhǐ,zhōng各,夅,夏本義「後至」。覆蓋「夊」。
    svsuī𡕞通用「夂」。
    pu放,𢼄,致
    pu寇,敍,㢭
    dldǎi𣦼,𣦸,𣦷
    mmmián室,穴
    mi㓁,軍,冝對照「宀」。
    xtxué𥥛,𥤻對照「宀」。
    ji互,彔
    \偏旁|二畫/
    fhfāng框右開口。
    xi框右開口,上橫出頭。
    kdkuàng尸,㠯,𠂤框左開口。假名,借形。💡音作「框」。
    jsjiōng冂,冋,冏框下開口。
    kjkǎn,qiǎn山屮框上開口。
    ihchǎng,hǎn,ān厰,巖
    广gdguǎng,yǎn,ān廣,廈對照「厂」。
    bubǔ,bo,pú占卜。
    bubǔ,bo,pú攴,占「卜」之變體。
    jxjié「節」之變省體。
    fu「阜」之變省體(左包耳)。覆蓋「⻏」[yì]。
    fu「阜」之變體。
    yi「邑」之變省體(右包耳)。通用「阝」[fù]。
    𠂉wuwǔ,rén午,(人)午,气,乞,㐌「人」作上部偏旁之變體,音取「午」,區分。
    dkdāo亇,負,刍
    dkdāo刈,刊,刑
    𠂊dkdāo夕,夂,夊
    sisī,mǒu公,厷,幺
    yi刈,爻,义除草,後作「刈」。覆蓋「㐅」。
    wu爻,义古文「五」。通用「乂」。
    ykyáo爻,𢂞,𢁫,𠛄卦象。對照「乂」「㐅」。
    tbtóu,èr
    fu枣(棗)重元符,表部件重複。音取「複」。見例百數。
    fu𡵁,𡖸重文符,表文字重複。音取「複」。見例極少。對照「⺀」。
    bybīng仌,冰冸,冲
    uvshuǐ水,氺泮,沖對照「冫」。
    uvshuǐ水,氵泰,𣱹,𱥯對照「氵」。
    fjfàn,jié,xiān犯,卷
    jijī,jǐ風,风,凡
    \偏旁|一畫/
    yi疋,𠁅,𠧘部首「乙」,非筆畫「橫撇」。
    yi九,几,虱
    jtjué𠃌,丁,于倒須鈎。標準音[jué]。
    jtjué丩,戉,𱍸反「亅」。標準音[jué]。
    hkháo,yǐ七,乙,孔
    𠃌gpgǔn勹,㔾,力鈎的倒尖。標準音[gǔn]。
    bkbāo包,旬,万古文「包」。對照「𠃌」。
    \筆畫/
    hghéng一,二,三筆畫:橫。
    tití,tiǎo,cè冫,氵,𤣩筆畫:提(挑、策)。
    uushù丄,丅筆畫:竪。
    ㇒,丿pxpiě人,入筆畫,獨字:撇。
    na人,入筆畫:捺。
    dmdiǎn亠,心筆畫:點。
    qrquān㔔,㫈,𠆭筆畫:圈。
    ㇖,乛yi疋,冖,宀筆畫,獨字:橫鈎(橫扁撇)。
    gbgōu,jué筆畫:彎鈎(彎)。
    jtjué弋,戈筆畫:捺鈎。
    ㇙,𠄌jtjué筆畫,獨字:竪提(竪挑)。
    ㇚,亅jtjué筆畫,獨字:竪鈎。
    ji筆畫:橫撇橫撇。
    ㇡,𠄎nlnǎi筆畫,獨字:橫撇橫撇鈎。
    ㇕,𠃍ji筆畫,獨字:橫竪。
    ㇗,𠃊ynyǐn筆畫,獨字:竪橫。
    ㇘,𠃎gbgōu,gòu筆畫,獨字:豎彎。
    ㇛,𡿨qrquǎn筆畫,獨字:撇點。
    ㇜,𠃋gsgōng厷,厶筆畫,獨字:撇橫。
    gsgōng筆畫:竪橫撇鈎。
    ybyòu筆畫:橫撇。
    ㇆,𠃌gpgǔn筆畫,獨字:橫竪鈎。
    ㇟,乚hkháo,yǐ筆畫,獨字:竪曲鈎。

    附錄二:疑難拆法速查表

    收錄高複用率單字疑難拆法、編碼。

    下表所列單字,自身未必僻見,而拆法往往疑難。因其複用率高,故常用其最簡拼式(多爲二分拼式)於複合字中。此表主要關注此類單字的最簡拼式

    注:此表並不羅列某字的所有拆法,而是按順序列出最優先拆法的一或多種

    注:某些字首選拆法從單字看未必最優,但從形近字組看是最優選擇(離散化),如「旧由甲申甴曱」之别。

    單字讀音拆法部件讀音編碼解釋
    lóng𦚏𳑳zhuāng‧lóngvdls留意「𦚏」「𳑳」。
    𦚏zhuāng立⺝lì‧ròulirb
    𳑳lóng与乚三yǔ‧háo‧sānyuhksj簡易。
    lóng立电lì‧diànlidm留意「电」。
    lóng尤㇒yóu‧piěybpx
    𣎆luò吂月凡máng‧yuè‧fánmhytfj留意「吂」。
    𣎆luò亡口月凡wáng‧kǒu‧yuè‧fánwhkbytfj
    yǔ,yù,yú𦥑与𬺢jú‧yǔ‧qíjuyuqi留意「𦥑」「𬺢」。
    xīng𦥑同𬺢jú‧tóng‧qíjutsqi
    mén𠁣𠃛jì‧yàjiya
    dòu𩰋𩰊jú‧jǐjuji
    xíng,háng彳亍chì‧chùiiiu
    yuè亼𠱠𠕁jí‧líng‧cóngjilycs留意「亼」「𠕁」。
    qiān亼吅从jí‧xuān‧cóngjixrcs留意「吅」。
    huì叀心zhuān‧xīnvrxn留意「叀」。
    yuàn,yuān口⺝kǒu‧ròukbrb
    yuàn,yuān厶⺝sī‧ròusirb
    pǐn口吅kǒu‧xuānkbxr
    yī,yì亠𧘇tóu‧yītbyi
    hé,gě亼口jí‧kǒujikb
    mìng亼叩jí‧kòujikb
    lìng,líng亽龴jí‧máojimk留意「亽」。
    jīn亽㇇jí‧yòujiyb
    彑氺jì‧shuǐjiuv留意「彑」。
    彑水jì‧shuǐjiuv
    ⺕氺jì‧shuǐjiuv留意「⺕」。
    yóu,liú𭤨子yǎn‧zǐyǎn‧zǐ留意「𭤨」。
    xuán,xuàn方𭻾fāng‧xuánfhxr
    xuán,xuàn𭤨疋yǎn‧pǐyjpi
    xiàng𬺨𧰨xiàng‧gèngxdgg留意「𬺨」。𬺨,二簡「象」。雖爲二簡,卻有獨特價值。
    miǎn𬺨儿xiàng‧érxder用「𬺨」又一例。
    𬺨xiàng⺈𫩏dāo‧qìdkqi留意「𫩏」。𫩏,二簡「器」。
    shǐ㇐𧰨héng‧gènghggg
    shǐ䒑𧰨cǎo‧gèngckgg
    shǐ豕㇔shǐ‧diǎnuidm
    shǐ彑𧰨jì‧gèngjigg
    bīng㇔水diǎn‧shuǐdmuv
    dōng夂⺀zhǐ‧fùvifu
    yōu山𢆶shān‧yōuujyb留意「𢆶」。
    xìng土𢆉tǔ‧rěnturf留意「𢆉」。
    十人shí‧rénuirf
    zhāng音十yīn‧shíynui字理。
    zhāng立早lì‧zǎolizk廣泛接受。
    huì,kuài人云rén‧yúnrfyp
    歹匕dǎi‧bǐdlbi
    止龰zhǐ‧zhǐvivi
    zhǐ,jié,jí⺊人bǔ‧rénburf留意「⺊」。
    戈止gē‧zhǐgevi
    huò戈𬺣gē‧dàngedj留意「𬺣」。
    bù,fǒu丆卜hǎn‧bǔhjbu留意「丆」。避免用「㇐𡭔」與「朩=㇐小」重碼。
    𦣻八shǒu‧bāubba不用「丆貝」以區别於簡形「页=丆贝」。
    丆贝hǎn‧bèihjbz
    匚コfāng‧kuàngfhkd留意「コ」。
    wèi木㇐mù‧héngmuhg字理。
    ㇐木héng‧mùhgmu字理。
    běn木㇐mù‧héngmuhg字理。避免用「大十」與「夲=大十」重碼。
    tāo,běn大十dà‧shídaui
    コ乚kuàng‧háokdhk
    コ乚kuàng‧háokdhk重碼避無可避,任之。
    口乚kǒu‧háokbhk「口乚」避「己已=コ乚」重碼。
    厤止lì‧zhǐlivi留意「厤」。
    厤日lì‧rìliri
    厂秝chǎng‧lìihli
    𠩵厂林chǎng‧línihln
    𨸏戶ココhù‧kuàng‧kuànghukdkd留意「戶」。
    𠂤duī戶コhù‧kuànghukd
    尸コshī‧kuànguikd
    𢑑duō𫜹𫜹xuě‧xuěxtxt留意「𫜹」。
    𠃓㇐勿héng‧wùhgwu
    𠃓𠄎𰀪nǎi‧yìnlyi
    可可kě‧kěkeke字理。
    jiān戈戈gē‧gēgege
    jiān,qián戈二gē‧èrgeer
    jiān戈㇐gē‧hénggehg
    𫠠㇔yì‧diǎnyidm
    𫠠㇐㇂héng‧juéhgjt留意「㇂」。
    𭠍㇐㇂㇒héng‧jué‧piěhgjtpx
    jīng,xíng㇐巛工héng‧chuān‧gōnghgirgs留意「巛」。
    𢀖jīng㇇㇔工yòu‧diǎn‧gōngybdmgs留意「㇇」。
    鹿广コ〢比guǎng‧kuàng‧xíng‧bǐgdkdxybi留意「〢」。
    qí,jì亠刀丫𱍸丿二㇑tóu‧dāo‧yā‧yī‧piě‧èr‧shùtbdkyayipxeruu留意「𱍸」。
    huāng亡𫶧wáng‧chuānwhir
    wáng,wú亠𠃊tóu‧yǐntbyn
    wáng,wú㇔匸diǎn‧xìdmxi
    𫶧chuān,kūn儿㇑ér‧shùeruu
    𫶧chuān,kūn丿㇑乚piě‧shù‧háopxuuhk
    huāng亾𫶧wáng‧chuānwhir
    chuān丿〢piě‧xíngpxxy
    wáng𠃊人yǐn‧rénynrf留意「𠃊」。
    lěi二木èr‧mùermu字理。
    虍几hū‧jīhuji陸標。
    虍儿hū‧érhuji兼容臺標。
    ㇒干piě‧gānpxgj
    shǐ𠂉大wǔ‧dàwuda
    shī㇒夫piě‧fūpxfu
    shì,zhī㇒𠄌𫠠piě‧jué‧yìpxjtyi
    jiù㇑日shù‧rìuuri
    yóu㇑曰shù‧yuēuuyt不用「日」。
    jiǎ曰㇑yuē‧shùytuu不用「日」。
    shēn十囗shí‧wéiuiwz不首選「㇑曰」以區分於「由」。
    zhá,yóu丄囗shàng‧wéiuhwz留意「丄」。不首選「㇑曰」以區分於「由」。
    yuē囗丅wéi‧xiàwzxw留意「丅」。不首選「曰㇑」以區分於「甲」。
    fāng亠勹tóu‧bāotbbk留意「勹」。
    wàn,mò㇐勹héng‧bāohgbk
    jīn全丷quán‧bāqrba
    jīn全丷quán‧bāqrba
    jīn𠂉王wǔ‧wángwuwh
    shí,sì,yì人良rén‧liángrfld
    shí,sì,yì人良rén‧liángrfld
    shí,sì,yì⺈㇙dāo‧juédkjt
    xiān⺧儿niú‧érnqer
    guāng⺌兀xiǎo‧wùxcwu
    yā,yà弓弓gōng‧gōnggsgs取巧,否則將陷入大量筆畫細節。末「弓」从反。
    yā,yà弓弓⿾gōng‧gōng‧⿾gsgsfn
    yā,yà㇐业héng‧yèhgye
    冂凵jiōng‧kǎnjskj簡易。省略連接筆畫,無礙字理。「冂」象高出,「凵」象坎陷。
    āo,wā凵凵kǎn‧kǎnjskj簡易。省略連接筆畫,無礙字理。
    jí,qì了叹㇐liǎo‧tàn‧hénglctjhg留意「叹」。
    lè,yuè,yào,lào𢆶𣐩yōu‧quánybqr留意「𣐩」。
    lè,yuè,yào,lào𠂆朩yì‧mùyimu留意「朩」。
    yǔ,yú龴𠄐máo‧gèmkge留意「𠄐」。
    yú,yù,ǒu田禸tián‧róutmrb留意「禸」。
    䖝冂chóng‧jiōngisjs留意「䖝」。
    㐫禸xiōng‧róuxsrb留意「㐫」。
    yù,yō𠫓⺝tū‧ròuturb留意「𠫓」。
    𠫓亠厶tóu‧sītusi
    𠫓厶㇐sī‧héngsihg
    shì日𤴓rì‧yǎriya留意「𤴓」。
    shì宀𤴓mián‧yǎmmya
    疋⺝pǐ‧ròupirb留意「疋」。
    qì,qiè,xiè㓞大qià‧dàqwda留意「㓞」。
    jié,xié㓞糸qià‧mìqwmi留意「糸」。

    附錄三:一點延伸探索

    也談「簡繁通打」

    所謂「簡繁通打」,目標是在一套方案中讓簡體與繁體都能快速輸出。

    做法有兩種:

    1. 爲簡繁字形賦予不同編碼,允許不切換模式而快速輸出簡繁。這是「分」。
    2. 讓多數簡繁字形重碼,利用模式切換輸出簡繁。這是「合」。

    兩種方式各有短長,無關對錯,只在取捨。

    有沒有第三條路?有的,通過適當設計,可以⸺愿合時合,愿分時分。換句話說,旣存在「相同編碼」,也存在「不同編碼」;不需要「模式切換」。

    譬如「頂顶」「顁𬱫」。本方案中:

      • dyye(丁頁/定頁/丁页/丁夜/鼎頁/定页/丁也)=頂顁顶𠅗𩕢𬱫𬺼
    • 半合
      • mmyaye(宀𤴓頁/宀𤴓页)=顁𬱫
      • hgjtye(㇐亅頁/㇐亅夜/㇐亅也)=頂顶𠅗𬺼
    • 半分
      • dyubba(丁𦣻八/定𦣻八/鼎𦣻八)=頂顁𩕢。注:有意避免將「頁」拆分作「丆貝」,以區分「页=丆贝」。
      • dyhjbz(丁丆贝/定丆贝)=顶𬱫
      • mupjpmye(目爿片頁)=𩕢。注:「𩕢」無類推簡「⿰鼎页」,故無「目爿片页」。
      • dyyeof(丁頁Ⓕ/定頁Ⓕ/鼎頁Ⓕ)=頂顁𩕢。注:可選便捷機制「簡繁直取」。
      • dyyeoj(丁页Ⓙ/定页Ⓙ)=顶𬱫。注:可選便捷機制「簡繁直取」。注:「𩕢」無類推簡「⿰鼎页」,故無「鼎页Ⓙ」。
    • 全分
      • hgjtubba(㇐亅𦣻八)=
      • hgjthjbz(㇐亅丆贝)=。注:實際應用中輸入至 hgjthj 卽可單選。
      • mmyaubba(宀𤴓𦣻八)=。注:實際應用中輸入至 mmyaub 卽可單選。
      • mmyahjbz(宀𤴓丆贝)=𬱫。注:實際應用中輸入至 mmyahj 卽可單選。
      • mupjpmubba(目爿片𦣻八)=𩕢。注:實際應用中輸入至 mupjpmub 卽可單選。
      • hgjttbrfvidm(㇐亅亠亻夂㇔)=𠅗。注:實際應用中輸入至 hgjttbrf 卽可單選。
      • hgjtmxuu(㇐亅乜㇑)=𬺼。注:實際應用中輸入至 hgjtmx 卽可單選。

    然而並非本方案刻意設計使然,「分合」的本質早已蘊涵在簡繁字部件自然稟性之中⸺形異音同(如上諸例)或形異音近(典型如「賓宾」)或形異音異(典型如「進进」)。這一本質在大量案例中自然浮現,本方案只是因勢利導,如此而已。

    另參考 一點哲學探討|魔然⸺談談「簡繁通打」

    關於「自動擴增」

    「自動擴增」是這樣一種内部實現機制:若一個單字存在「二分」拆法(廣泛存在),通過代碼腳本查詢其所有部件的二分拆法,並「擴增」拆分到「三分」;進一步,再「擴增」拆分到「四分」。以此兼顧易用性(二分、三分)與極致單選(四分)。

    舉例⸺「語」:

    • 二分:訁吾。⸺手工拆分。
    • 三分:㊀亠二口吾。㊁訁五口。⸺自動擴增。
    • 四分:亠二口五口。⸺自動擴增。

    初始「二分」拆解均手工操作或確認,確保質量;擴增「三分」「四分」均通過代碼腳本實現,確保覆蓋率。

    額外地,部分字在三分或四分拆解上作人工優化,以作字形兼容(碼同形異,各地標準不同)、容錯(因筆畫密集而誤識)。

    數據⸺字符總數: 102369,拆法總數: 550854。單字平均拆法≈5.38。

    關於「調頻」

    1. 不作靜態調頻,字序取碼點序。理由:現代文、古文輸入場景字頻衝突,任意字頻方案均無法兩全。拆法已足够豐富,大多數情況下足以應對「手動調頻」需要(使用過程中,依實際場景所需,變換拆法以實現「手動調頻」)。
    2. 不作動態調頻。理由:固定字頻,以利於盲打。
    编辑于 2026-05-18 · 著作权归作者所有