|
| File: |
|
| Description: |
分词盒子是一个纯Java开发的、100%与Lucene兼容的多语言分词工具包,本工具包暂时不支持Lucene 3.x的API,不久将推出完全兼容Lucene 3.x的版本。
此工具包主要用于搜索类的应用,对切分速度和召回率的要求要高于准确率,故采用了正向最大/最小匹配和全切分算法,同时支持用户自定义词典扩展,支持任何语言(如:中文、日文、韩文)的词语和英文短语的识别,支持用户自定义词性。 |
| SHA1 Checksum: |
ef497a2b9d69bdac01dd6ea05e790a549a838c2e
What's this?
|
|
|