| Projects on Google Code | Results 1 - 10 of 111 |
Javascript框架: Mootools v1.2的参考文档(中文版)
#summary One-sentence summary of this page.
= Introduction =
Based on the character map found in MediaWiki to convert Java String between traditional and simplified Chinese characters
= Details =
{{{
// Instantiation will fetch the property file which load the Chinese character mappin...
imdict-chinese-analyzer 是 [http://www.imdict.net/ imdict智能词典] 的智能中文分词模块,算法基于隐马尔科夫模型(Hidden Markov Model, HMM),是中国科学院计算技术研究所的[http://ictclas.org/ ictclas]中文分词程序的重新实现(基于Java),可以直接为lucene搜索引擎提供*简体中文*分词支持。
=Apache Lucene的中文分词=
[http://lucene.apache.org Apache Lucene]是java实现的一个高效的文本搜索引擎软件,它适用于几乎所有要求全...
开放的中文分词项目
高性能、高可用性分词系统
高质量开发社区
===Paoding Analysis摘要===
*Paoding's Knives* 中文分词具有极 _高效率_ 和 _高扩展性_ 。引入隐喻,采用完全的面向对象设计,构思先进。
高效率:在PIII 1G内存个人机器上,*1秒* 可准确分词 *100万* 汉字。
采用基于 _不限制个数_ 的词典文件对文章进行有效切分,使能够将对词汇分类定义。
能够对未知的词汇进行合理解析
===欢迎===
如果对该项目您有任何建议,欢迎您在http://code.google.com/p/paoding/issues/list 中提出各种issues.
用心的贡献,极其...
Chinese Character Code for Information Interchange implementation
中文資訊交換碼 is an coding system for full range Chinese character set (around 50~70K)
=短期目標=
在Emacs 上用mule-cccii 實現對CCCII 大字集的支援,作為基本測試平台。
==子目標==
# 輸入
emacs 可以用xim 輸入法也可以用內建的quail 輸入法,預計先從quail 開始,短期目標不求效率。把基本測試平台先建立起來,後面再...
CNLP(Chinese natural language processing,中文自然语言处理)的研究有巨大的研究价值。这个工程的目的是:分享中文自然语言处理中常见算法的实现。比如词相似中的Cosine算法。
该项目主要是我在学校实验室实现的与中文NLP研究有关的一些工具。
公开这些源代码是基于个人对开源精神的敬仰,本着促进中文自然语言处理研究的精神。任何人可以随意传播或修改源代码,用于任何善良的目的。
如果大家也有类似的工程,愿意和大家分享的话可以Email给我,我会将其在这里展现出来,供大家学习和使用。
*注:因为 v4.0 已经流露出太多的流氓气质,本语言包将可能不再更新。不过 v3.0 同样可以用在 v4.0 中,大部分常用功能都已正常汉化,少量新增功能(一般很少用)可能会显示成为“TODO”。你也可以自己手动汉化,欢迎将你提交分享自己的语言包文件。*
这些流氓气质包括:
# 安装文件实质上只是一个下载器,安装过程中需要联机下载真正的安装文件
# 安装过程中,无法取消安装针对IE和Firefox的插件,甚至修改IE浏览器默认页
# 运行前需要登录到服务器,甚至默认选中上传族谱资料到服务器
不过就软件本身来说,还是相当不错的。
[http://www.myhe...
[http://nlpbamboo.googlecode.com/files/bamboo.png]<wiki:gadget url="http://www.ohloh.net/projects/nlpbamboo/widgets/project_users.xml" height="100" border="0" />
= 最新更新 =
Bamboo 1.1.1 重要更新
Bamboo 1.1.1正式发布,请点击右侧的Feature Download进行下载。该版本修正了一些愁人的Bug。
== Changelog ==
1.1.1:
* 修正了Makefile...
ChineseSegmentation,
ChineseTokenize,
NatrualLanguageProcessing,
NLP,
中文分词,
命名实体识别,
主题词提取,
自然语言处理,
NER,
KeywordExtraction
a set of localization tools to make python support Chinese and Chinese culture better.
Contact me (panjy at zopen dot cn) if you want to contribute.
聚合国内python人的力量,建立一整套python的中文本地化工具包。
gb18030的python-codec是韩国人帮咱们写的,这个有些汗了。自己的事情,还是应该由咱们自己来完成!
典型的是:
1. 汉字 -> 拼音 转换
2. 中英文字数统计
3. 公...