学习汉语,哪款字词典工具是你的「效率神器」?
当然是利用词典软件挂载mdx词典了。
下图是我朋友制作的《说文解字》词典,还有更多词典,版权原因就不细说了。


挂载mdx词典,一般使用mdict、深蓝词典、欧路词典、dicttango、goldendict,今天推荐一下飞梧制作的toymdict。
https://github.com/asgsdbrseg/ToyMDict其最主要特色是关联了更多异体字,有些mdx的录入经常令人费解,不符合任何用字标准,检索时经常遗漏,有了toymdict就能很好兼容。
当搜索「黄钟」时,它会自动匹配2×4=8种组合,把8种组合全搜一遍。实际检索发现,不同mdx词典竟然使用了其中五种组合。



对于简繁混用的条目,部分mdx软件往往是无能为力的,toymdict也能搜到。


搜赵干,可出现赵幹。

钱锺书

赵孟𫖯

穀梁传

战斗

恶心

争斗

竞争

录录

简直

复道

绝对

游戏

游玩

生发

闲人/间人

余子

太平天国

奸譌

异体字



补充一下作者飞梧今日分享的内容:
Mdict工具不乏其类,尤其是AI时代,更是井喷,为什么还要再做一个?
毫不客气地说,其他词典软件的初衷都是学习外语,只有ToyMDict是专为汉语开发的。
先说一下当前主流的词典软件的简繁实现和不足。
Mdict和深蓝词典把一对多腰斩了,「发」只和「發」对应,无论如何是搜不到「髮」的。
平典(又叫无限词典)倒是解决了一对多,它的问题是不支持扩展区汉字,也不能自定义。
GoldenDict和DictTango接入了opencc,局限也在于opencc。
首先,opencc的体量太小,《汉语大词典》收词37万,相较之下,opencc的体量可以忽略不计了。
其次,opencc对一对多的处理是默认返回第一个。这意味着所有包含「髮」的词组你要手动加入转换表,否则默认转换成「發」。

而一旦将含「髮」的词加入转换表,它就再也匹配不到「發」了。

第三,opencc以及主流的简繁转换本质都是「陆台转换」。opencc至今没有新字形的词表,所以你无法得到「戰争」。

诸位如果也使用以上软件,可自行验证我的说法。
即使opencc能完美解决简繁转换的问题,也不能解决词典搜索的问题。
「钱钟书」和「钱锺书」不是简繁关系,「説文」和「說文」也不是简繁关系。
opencc是输出工具,它需要精确。但搜索是输入工具,它不需要这种精确,只要在一组关键词中命中其中几个就行。
所以,我们看到古籍数据库没有只做简繁转换的,全部都是异体字关联。
转换和关联是不同的。 转换是单向的,简→繁,或繁→简。 关联是多向的,每个字都有简繁异多种形式,和其他字的简繁异多种形式任意组合。
ToyMDict也是相同的操作。在异体字表中加入这样的内容。


当你搜索「黄钟」时就会自动匹配2×4=8种组合。这和你手动搜索8种组合效果是一样的,软件唯一的作用是把手动变成自成。

这就是核心功能,至于操作方面,没有什么可设置的地方,只有两个按钮和一个搜索框。一个导入词典,一个给词典分组,然后就可以搜索了,纯傻瓜式操作。

当你收集了1万本词典,却查不到任何有效内容,等于白收集了,只是1万个占空间的垃圾。查不到任何内容的GoldenDict。
