| Projects on Google Code | Results 1 - 10 of 10 |
ictclas is a lib for cutting Chinese words.
website is : http://ictclas.org/
and this package is a python package for invoking this cutter.
Depends:
Make sure you download the ictclas linux 2009 package and make sure you install boost-python
step:
1: check out this package ( this package...
OpenCLAS是一个开源的中文词法分析库。其中包括了中文分词、词性标注等功能。系统使用基于概率的多层HMM。可以对已登录词和未登录词进行识别分析。
OpenCLAS是对原有的ICTCLAS (中科院中文词法分析系统)进行的重写。OpenCLAS将不包含任何ICTCLAS中的源代码,并且以BSD协议发布。因此其代码可以在满足BSD协议的前提下,用于包括商用在内的各种场合。
OpenCLAS将包含三个语言分支,C++, Java和C#。(目前只实现了C++的版本)。
[Roadmap 开发计划]
ICTCLAS,
NaturalLanguageProcessing,
ChineseLexicalAnalysis,
CPP,
Java,
CSharp,
自然语言处理,
中文分词,
CPlusPlus
Cutter Server in cpp using ictclas and thrift
ictclas4j中文分词系统是sinboy在中科院张华平和刘群老师的研制的FreeICTCLAS的基础上完成的一个java开源分词项目,简化了原分词程序的复杂度,旨在为广大的中文分词爱好者一个更好的学习机会。
关于ICTCLAS分词系统的讨论,请访问google group关于ictclas分词系统的讨论组http://groups.google.com/group/ictclas
=注:最新的分词系统 HTTPCWS 已经发布,用来取代 PHPCWS。=
=请点击以下网址下载 HTTPCWS:=
=http://code.google.com/p/httpcws=
=原来的 PHPCWS 停止更新。=
----
==Introduction in English==
PHPCWS is a open-source PHP Extension for Chinese Word Segmentation, using ICTCLAS Chinese word segmentation algorithms and Reverse maxi...
php,
expansion,
chinese,
word,
segmentation,
phpcws,
ICTCLAS,
中文分词,
分词,
PHP扩展,
汉语分词,
搜索引擎,
全文索引,
china,
CJK
==Introduction in English==
HTTPCWS is a open-source Chinese Word Segmentation System Based on the HTTP protocol, using ICTCLAS Chinese word segmentation algorithms.
ICTCLAS is a Chinese lexical analysis system, which is able to make Chinese word segmentation, Part-Of-Speech tagging, word ...
php,
expansion,
chinese,
word,
segmentation,
phpcws,
httpcws,
ICTCLAS,
中文分词,
分词,
汉语分词,
搜索引擎,
全文索引,
china,
CJK
==基于ICTCLAS的中文分词程序MyCLAS和用户词典管理程序MyDict==
===1. 介绍:===
1) 中科院计算所开发的中文分词和词性标注程序*ICTCLAS*,在性能和准确性上都较优;但是由于使用C语言开发,因此如果需要在Web应用程序使用ICTCLAS分词结果的话,将不是很方便。
为了解决该问题,我借助于共享版ICTCLAS提供的API使用C语言开发了简易的中文分词和词性标注程序: *MyClas* 。
它可以从标准输入中获取要处理的字符串,然后进行分词和词性标注,并将结果输出到标准输出中。
这样,假如需要在PHP编写的Web应用程序中对一个字符...
ICTCLAS is an open-source Chinese Segmenter. This is a modified version for linux. A perl binding is also provided.
ICTCLAS is an open-source Chinese Segmenter. This is a modified version for Windows.
A python port of free ICTCLAS library.