深蓝词库转换1.9发布——支持英库拼音、搜狗bin格式、FIT、中州韵等

经过了3个多月的沉寂,今天深蓝词库转换终于迎来了1.9版。这次版本升级主要包含了以下新特性:

一、支持微软英库Engkoo拼音输入法。

微软英库(Engkoo)拼音输入法是微软新推出适用于Win8的输入法,虽然还在Beta阶段,但是发展比较迅猛,最近的版本中已经支持文本词库的导入,所以想尝鲜使用英库输入法的同学们不用担心你之前使用的QQ拼音或者搜狗拼音的积累了那么久的词库无法在英库输入法中使用。

深蓝此刻转换能够支持将各种词库文件转换为英库拼音输入法的词库。杯具的是Engkoo拼音输入法一次只支持10000条词条,所以如果词条数据比较大的话,那么就需要分割转换后的词库文件,每个词库文件10000条,然后再依次导入。希望接下来的Engkoo输入法能够取消该限制。

二、新增文件分割功能,可以按照设定的词条行数、文件大小或者字符个数进行分割。

这个功能主要是针对Engkoo拼音输入法的一次只能导入10000条词条的限制而做的,我在搜狗拼音下有个人词库16W条,这Engkoo输入法只支持其中的1W条显然是不能满足我的要求的,所以需要将生成的Engkoo词库进行分割。选择帮助菜单下的“文件分割”选项,可以弹出文件分割窗口,选择转换而来的Engkoo词库,然后选择按行数分割,每个文件1W行,然后就可以将该转换而来的Engkoo词库分割成16个文件,如图所示:


然后进入Engkoo输入法,选择“专业词典”选项,一个个点击“导入文本词库”即可将我原来搜狗拼音里面的词库转换到英库输入法中。


三、支持搜狗拼音bin格式备份词库。

搜狗拼音虽然支持文本格式词库的导出,但是在其文本词库中不包含词频信息,所以我花了点时间对搜狗拼音输入法的bin格式备份词库进行格式分析,终于实现了对其的解析。具体操作方法和普通词库转换方式方式类似,先在搜狗拼音输入法的设置面板的词库选项卡中选择“词库备份”,单击“执行该操作”按钮,即可将当前的词库备份以bin格式备份到硬盘上。然后将该bin文件选择到深蓝词库转换中,选择词库源为“搜狗拼音备份词库bin”,目标选择需要转换的其他输入法,然后单击转换按钮即可完成bin词库的解析和转换。


四、支持中州韵(小狼毫、鼠须管)输入法。

中州韵输入法引擎是一个跨平台的开源输入法引擎,在Linux上叫中州韵,在Windows下叫小狼毫,在Mac上叫鼠须管。软件下载地址:http://code.google.com/p/rimeime/

经过试用,这是一款非常不错的输入法,尤其是在Linux和Mac下其他好用的输入法太少。我由于平时使用的是Win7,所以就以Windows下的小狼毫为例,说明如何将用户词库转换到小狼毫中。首先将深蓝词库转换中将目标选成“中州韵”,然后转换并保存到硬盘上。


接下来是在Windows的托盘图标中找到小狼毫的图标,右击选择“用户词典管理”,然后选择luna_pinyin,单击“导入文本码表”,选中刚才保存的文件,马上就可以将我们的词库导入到小狼毫的词库中了。


该词库同样可以导入到Mac版的鼠须管输入法中,下载鼠须管的词库导入工具(http://code.google.com/p/rimeime/downloads/detail?name=rime_dict_manager_0.9.2_osx.zip&can=2&q=),然后按照导入工具的命令格式,将我们的搜狗拼音词库导入到鼠须管的命令为:

./rime_dict_manager –i luna_pinyin Sougou.txt

运行结果如图所示,正确导入了我们的搜狗词库。


五、支持FIT输入法。

FIT输入法是Mac下非常出名的输入法,由于我很少使用Mac,所以一直没有涉及到这个输入法。最近有人在项目网站上给出了FIT输入法的词库文件,我就照猫画虎,按照FIT词库的格式,实现了FIT输入法词库的转换。在Mac虚拟机上测试,能够正常导入。在Mac的FIT输入法的“输入法设置”窗口中,选择词库选项卡,然后单击词库列表下的+按钮,添加我们转换而来的FIT词库,不一会儿即可把我们转换的词库导入到FIT输入法中,下图是导入成功的FIT词库页面:


需要注意的是,FIT对大数据量的词库导入支持不是很好,速度很慢,所以还是得需要前面提到的文件分割器,将用户词库分割成多个文件,然后再依次导入。

六、增强自定义格式的导出功能,以支持更多的输入法。

现在的五笔输入法虽然没有拼音输入法那么流行,但是算下来还是有七八种常用的五笔输入法,而且这些五笔输入法也在持续更新并支持词库的导入导出,所有我也根据这些五笔输入法词库的特点,增强了自定义格式的导出功能,实现了其词库的转换。由于本软件没有五笔词根的生成功能,所以对于不支持纯汉字导入的五笔输入法,可以先使用搜狗五笔或者QQ五笔,将转换后的纯文本词库导入,然后到处成带五笔编码的词库,再导入到其他五笔输入法中。

  • 小鸭五笔本身支持存文本词库的导入到五笔输入法中,小鸭五笔也支持拼音词库,不过其格式与其他输入法不同,一个词的各个字的拼音之间是没有间隔的,所以我在自定义的格式中加入了拼音之间无分隔符的支持。
  • 万能五笔不支持纯文本词库的导入,只支持“编码 汉字”这种格式的词库。
  • 光速五笔输入法,感觉应该和万能五笔是同一个东西,界面非常类似,本机测试导入词库有Bug,无法导入自己导出的词库。
  • 搜狗五笔,支持纯文本词库导入。
  • QQ五笔,支持纯文本词库导入。
  • 万能五笔,五笔支持“编码 汉字”这种格式的词库,拼音词库支持“拼音无分隔符 汉字”格式的词库,可以通过自定义格式导入。

七、优化代码,修改Bug。

从代码级整合了QQ分类词库专用的Zip压缩算法所用的库,使得最终程序就只有“深蓝词库转换.exe”这么一个文件,不会有其他依赖的dll文件。修改了发现的Bug,对文件类型过滤、文件格式感知进行了优化。

最后,深蓝词库转换软件是一个免费开源的软件,软件本身无任何收费和使用限制。本次更新为深蓝词库转换增加了个捐赠选项,感谢大家一直以来的支持,如果您觉得深蓝词库转换能够给您的生活带来了极大的方便,可以通过Paypal或者支付宝捐赠该软件。

深蓝词库转换1.9下载

时间: 2024-10-27 12:18:16

深蓝词库转换1.9发布——支持英库拼音、搜狗bin格式、FIT、中州韵等的相关文章

深蓝词库转换2.0发布——支持仓颉、注音、五笔、郑码、二笔等

经过了2个多月的改进,终于深蓝词库转换2.0版正式与大家见面了.在1.9版本中增加了对Rime拼音输入法的支持,也得到了网友的反馈,所以在2.0版本中增加了几个新功能: 一.支持多种编码的Rime输入法. Rime输入法是一款跨平台的输入法框架,在Windows下叫小狼毫,Linux下叫中州韵,Mac下叫鼠须管.这个输入法框架异常强大,支持各种常用的输入法,而且还可以通过简单的配置自定义输入法.深蓝词库转换在1.9版本中增加了对Rime拼音输入法的支持,现在在2.0中进行了增强,除了拼音外,还能

深蓝词库转换1.2版本发布——支持紫光拼音和拼音加加

之前推出了深蓝词库转换工具,受到大家的欢迎,有朋友陆陆续续来信,希望增加一些实用的功能,于是乎今天深蓝词库转换1.2推出.该版本主要实现了3个新功能: 1.支持紫光拼音输入法的词库导入导出. 紫光拼音这个就不用我介绍了吧,当年搜狗拼音还没有推出之时,紫光拼音是我见过的最好用的拼音输入法了.现在紫光输入法还在不断推出新版本,同时也支持了词库的导入导出.如果想从搜狗输入法或者QQ输入法转换到紫光输入法,或者想回味一下紫光输入法,那么我想深蓝词库转换1.2的这个新功能应该能够让不少同学受益. 以搜狗细

深蓝词库转换1.8发布

经过一段时间网友提出的新的需求,鄙人利用闲暇时间对深蓝词库转换程序进行了升级,现将1.8版本发布. 老生常谈,深蓝词库转换是一款.Net 2.0平台的各输入法词库互转程序.有了这个工具,各种词库在各种输入法,PC和手机上都通用了. 目前支持的输入法有: PC端: 搜狗拼音(文本词库和scel格式细胞词库) QQ拼音(文本词库和qpyd格式分类词库) QQ五笔(纯汉字) 谷歌拼音 搜狗五笔 紫光拼音 拼音加加 新浪拼音 极点郑码 百度拼音(文本词库,bdict格式) 微软拼音 小小输入法(拼音)

深蓝词库转换1.6发布

由于在技术上和功能上没有什么突破,一直心里的痛就是对QQ拼音分类词库(qpyd格式)的解析,一直无从下手,所以这半年来我一直都没有发布新版本的"深蓝词库转换".期间也收到了很多朋友的来信,提出了修改意见和建议,我表示非常感谢.最近听闻搜狗细胞词库(scel格式)的内部格式有所改变,最新的词库文件1.5版无法进行解析了,所以我经过调试修改了解析的算法,发布1.6版. 这次发布我个人觉得没有什么大的改进,下面还是总结下与1.5版比有什么不同吧: 修改了搜狗细胞词库(scel格式)的解析算法

深蓝词库转换1.5发布

经过了漫长的修改,终于把深蓝词库转换1.5完成了.这次修改注意包括以下改进: 1.增加百度输入法bdict词库导出的功能. 百度输入法也推出了自己的分类词库,词库格式为bdict,这个词库格式比较简单,用户如果喜欢某个词库,可以将该百度分类词库转换为自己习惯的输入法.比如我们觉得百度分类词库中的动漫作品词汇这个词库不错,但是用的又是搜狗输入法,所以需要将该词库转换为搜狗输入法. 2.增加拖拽选择词库功能. 用户在文件夹中选中单个或者多个词库文件,然后拖拽到窗口上方,系统将会把用户选中的文件显示在

新浪出输入法了,深蓝词库转换更新到1.3.1——增加对新浪拼音输入法的支持

新浪最近出了自己的输入法,具体介绍我就不说了,参见这里.由于之前一直做深蓝词库转换的工具,目前已经支持了大部分主流的输入法词库的转换,既然出了一个新的输入法,那么肯定要增加对这个输入法的词库的支持了. 新浪输入法虽然才发布第一个版本,功能还不够强大,但是幸好支持了词库的导入和导出功能(我目前拿到的是0.9内测版,1.0正式版由于网站挂了,没有下载到,词库功能上应该不会有什么变化).如果我们想尝鲜新浪输入法,但是又苦于新的输入法没有自己多年来打字积累的词库,那么深蓝词库转换现在可以帮你快速上手.

深蓝词库转换1.3版本发布——增强单词注音功能

"深蓝词库转换"是我在闲暇时写的一个词库转换程序,实现了各种输入法的用户词库.网络词库(细胞词库)之间的相互转换. 目前支持的输入法有: PC端: *搜狗拼音 *QQ拼音 *QQ五笔(纯汉字) *谷歌拼音 *搜狗五笔 *紫光拼音 *拼音加加 手机端: *QQ手机拼音 *百度手机拼音 由于工作和个人的原因,所以深蓝词库转换很久很久没有更新了,趁着这个国庆有时间,所以对该小程序做了下版本更新,主要更新的功能有: 1.增强了单词注音功能. 有些词库是只有汉字而完全没有拼音的词库,这种词库要转

重新写了一个拼音输入法词库转换小程序

之前,由于我要从QQ拼音平台转换到搜狗拼音上,所以我写了一个小程序把QQ拼音词库转换为搜狗拼音词库.后来陆续收到来信,索要程序同时也希望把搜狗拼音词库转换为QQ拼音,所以我就在这个小程序上做了一点改进.这两天我给手机换了百度拼音输入法,之所以用这个输入法是因为这个输入法可以将词库保存到服务器上,那么我重装系统后重新安装输入法就可以把服务器上我的词库同步到我的手机上了.百度手机输入法支持本地文本文件的备份和还原,所以我就希望将我电脑中的输入法词库导入到手机中,这样我平时发短信就更快了. 为了能够把

[译] 当发布安卓开源库时我希望知道的东西

本文讲的是[译] 当发布安卓开源库时我希望知道的东西, 原文地址:Things I wish I knew when I started building Android SDK/Libraries 原文作者:本文已获作者 Nishant Srivastava 授权 译文出自:掘金翻译计划 译者:jifaxu 校对者:BoilerYao, gaozp 当发布安卓开源库时我希望知道的东西 一切要从安卓开发者开发自己的"超酷炫应用"开始说起,他们中的大多数会在这个过程中遇到一系列问题,而他