何ですかこれはMeCabをJavaから利用するためのライブラリです。以下のコンポーネントから構成されます。 - MeCabのJNIバインディング
- SWIG不使用、辞書のエンコーディングとUnicodeの間で自動変換を行います。
- MeCabおよびSenを用いたLucene用Tokenizer、素性情報を用いてフィルタリングを行うTokenFilter、およびAnalyzer
- TinySegmenterのJava移植版およびTokenizer, TokenizerFactory
- サロゲートペアを正しく認識するCJKTokenizerクローン
- Solr用TokenizerFactory、TokenFilterFactory
ライセンス- Public Domain (プロジェクト情報にはMIT licenseと書いてありますが、本当はPublic Domainです)
- ただし、TinySegmenterに関する部分のみは、修正BSDライセンスです。
ドキュメント類
|