My favorites | Sign in
Project Home Downloads Wiki Issues Source
Project Information
Members
Featured
Downloads
Wiki pages
Links

何ですかこれは

MeCabをJavaから利用するためのライブラリです。以下のコンポーネントから構成されます。

  • MeCabのJNIバインディング
    • SWIG不使用、辞書のエンコーディングとUnicodeの間で自動変換を行います。
  • MeCabおよびSenを用いたLucene用Tokenizer、素性情報を用いてフィルタリングを行うTokenFilter、およびAnalyzer
  • TinySegmenterのJava移植版およびTokenizer, TokenizerFactory
  • サロゲートペアを正しく認識するCJKTokenizerクローン
  • Solr用TokenizerFactory、TokenFilterFactory

ライセンス

  • Public Domain (プロジェクト情報にはMIT licenseと書いてありますが、本当はPublic Domainです)
  • ただし、TinySegmenterに関する部分のみは、修正BSDライセンスです。

ドキュメント類

Powered by Google Project Hosting