My favorites | Sign in
Project Home Downloads Issues
READ-ONLY: This project has been archived. For more information see this post.
Search
for
Download: 分词盒子1.0 Stable
 
Uploaded by:  hezhe...@gmail.com
Released: Jan 16, 2011
Uploaded:  Jan 16, 2011
Downloads: 146
中文分词
Chinese Word Segmentation
自然语言处理
NLP



File:
Download  fencibox-1.0.jar   22.9 KB
Description:
分词盒子是一个纯Java开发的、100%与Lucene兼容的多语言分词工具包,本工具包暂时不支持Lucene 3.x的API,不久将推出完全兼容Lucene 3.x的版本。

此工具包主要用于搜索类的应用,对切分速度和召回率的要求要高于准确率,故采用了正向最大/最小匹配和全切分算法,同时支持用户自定义词典扩展,支持任何语言(如:中文、日文、韩文)的词语和英文短语的识别,支持用户自定义词性。
SHA1 Checksum: ef497a2b9d69bdac01dd6ea05e790a549a838c2e What's this?



Powered by Google Project Hosting