My favorites | Sign in
Project Home Downloads Wiki Issues Source
Search
for
VimimSqlite  
Unihan 数据库词库
Updated Dec 7, 2010 by maxiangjiang

即插即用Unihan〖数据库词库〗

Unihan (CJK Unified Ideographs) 被翻译成中日韩统一表意文字。
概念大于四海之内,也大于两岸三地。

Unihan 既标准又权威,而且实用。有人抱怨Unicode排序乱七八糟,其实
是不懂汉字的内涵。Unicode排序源自《康熙字典》,符合六书的规律,
是绝对的权威。

Unihan词库的格式跟我们的VimIM词库格式一样,文本文件,天下无敌。
Unihan词库包罗万象。有简体,有繁体,有汉语拼音,有四角号码,有仓
颉码,还有英文解释。Unihan词库引经据典,毫无水分,因为不必顾忌皇
恩浩荡。如果不玩玩Unihan, 感觉有点对不起自己。

以Unihan作为词库的应用程式有如雨后春笋,不过大多用于汉字查询。如
果我们把Unihan中的每一个汉字看作是一个Object. 每一个Object有自己
的Property. 从理论上讲,我们完全可以把Unihan词库当做中文输入法的
词库。VimIM牛刀小试,就把理论变成现实。

我们需要的是即插即用,不换模式,不用快捷键。想敲简体就敲简体,想
敲繁体就敲繁体,想查英文就敲英文。而且,需要的时候才调用,不需要
用的时候,不耗任何资源。

VimIM全部满足以上要求。我们以SQLite作为VimIM的后端,唯一的条件是
具备sqlite3. 具体操作如下: 

- 【注】SQLite 支持仅仅限于VimIM 版本 0.9.7

- 下载方式:

  (1) 程式:http://vim.sourceforge.net/scripts/script.php?script_id=2506
  (2) 词库:http://vimim-data.googlecode.com/svn/trunk/data/cedict.db

- 安装方式:

  (1) 程式:$VIM/vimfiles/plugin/vimim.vim
  (2) 词库:$VIM/vimfiles/plugin/cedict.db

- 使用方式:

  * 汉语拼音输入中文简体: vim sqlite.vimim
  * 汉语拼音输入中文繁体: vim SQLITE.vimim
  * 敲英文,找中文简体:   vim sqlite.english.vimim
  * 敲英文,找中文繁体:   vim SQLITE.english.vimim

- 自我评估:

   Though we have successfully showed that SQLite database can
   be used as an embedded backend for VimIM, it is not suitable
   for everyday use. The situation would be better if we can (1)
   fine tune Sqlite Unihan database (2) "merge" sqlite3 into vim
   code base.  The concept of using database as backend for
   input method cannot be under-estimated.

欢迎批评指正。


PS: 

(1) Unihan〖数据库词库〗来自 cjklib 一字未改:

  + 源头是Unicode官方的Unihan
  + wget ftp://ftp.unicode.org/Public/UNIDATA/Unihan.zip
  + http://code.google.com/p/cjklib/wiki/QuickStart
  + /bin/buildcjkdb -r build cjklibData
  + ls /usr/local/share/cjklib/cedict.db

(2) Unihan〖数据库词库〗的大小:

  + 总词条:九十九万条纪录
  + 数据库词库文件:15MB on disk

(3) 实验器材 vimim.vim

vimim
computer 電腦:Windows32_builtin_gui 
Vim      版本:gvim.exe 703 
VimIM    版本:vimim.vim 4457 
encoding 編碼:utf-8 
fencs    編碼:ucs-bom,utf8,chinese 
fonts    字體:YaHei_Consolas_Hybrid,NSimSun-18030 
lc_time  環境:English_United
mode     風格:OneKey normal <CTRL-6>  
im       輸入:【拼音+數碼】OneKeyNonStop 
database 詞庫:目錄詞庫:/home/vimim/pinyin/ 
database 詞庫:目錄詞庫:/home/vimim/unihan/ 
cloud    搜狗雲:想雲就雲 
Comment by nightrai...@gmail.com, Dec 15, 2010

where to get these .vimim files, sir ?

  • 汉语拼音输入中文简体: vim sqlite.vimim
  • 汉语拼音输入中文繁体: vim SQLITE.vimim
  • 敲英文,找中文简体: vim sqlite.english.vimim
  • 敲英文,找中文繁体: vim SQLITE.english.vimim

Sign in to add a comment
Powered by Google Project Hosting