My favorites | Sign in
Google
Projects on Google Code Results 1 - 6 of 6
imdict-chinese-analyzer 是 [http://www.imdict.net/ imdict智能词典] 的智能中文分词模块,算法基于隐马尔科夫模型(Hidden Markov Model, HMM),是中国科学院计算技术研究所的[http://ictclas.org/ ictclas]中文分词程序的重新实现(基于Java),可以直接为lucene搜索引擎提供*简体中文*分词支持。 =Apache Lucene的中文分词= [http://lucene.apache.org Apache Lucene]是java实现的一个高效的文本搜索引擎软件,它适用于几乎所有要求全...
[http://nlpbamboo.googlecode.com/files/bamboo.png]<wiki:gadget url="http://www.ohloh.net/projects/nlpbamboo/widgets/project_users.xml" height="100" border="0" /> = 最新更新 = Bamboo 1.1.1 重要更新 Bamboo 1.1.1正式发布,请点击右侧的Feature Download进行下载。该版本修正了一些愁人的Bug。 == Changelog == 1.1.1: * 修正了Makefile...
CNLP(Chinese natural language processing,中文自然语言处理)的研究有巨大的研究价值。这个工程的目的是:分享中文自然语言处理中常见算法的实现。比如词相似中的Cosine算法。 该项目主要是我在学校实验室实现的与中文NLP研究有关的一些工具。 公开这些源代码是基于个人对开源精神的敬仰,本着促进中文自然语言处理研究的精神。任何人可以随意传播或修改源代码,用于任何善良的目的。 如果大家也有类似的工程,愿意和大家分享的话可以Email给我,我会将其在这里展现出来,供大家学习和使用。
OpenCLAS是一个开源的中文词法分析库。其中包括了中文分词、词性标注等功能。系统使用基于概率的多层HMM。可以对已登录词和未登录词进行识别分析。 OpenCLAS是对原有的ICTCLAS (中科院中文词法分析系统)进行的重写。OpenCLAS将不包含任何ICTCLAS中的源代码,并且以BSD协议发布。因此其代码可以在满足BSD协议的前提下,用于包括商用在内的各种场合。 OpenCLAS将包含三个语言分支,C++, Java和C#。(目前只实现了C++的版本)。 [Roadmap 开发计划]
开放的中文分词项目 高性能、高可用性分词系统 高质量开发社区
基于知网的中文词语相似度计算,java 版本 其中的词库资源由中文“自然语言处理开放平台(http://www.nlp.org.cn)” 遵循“自然语言处理开放资源许可证”, 该许可证随代码一同发布。