|
2009-03-19 - 修正了Makefile不能指定lib路径的问题,现在64位RH机器的用户不需要手工拷贝lib到lib64了
- 修正了一个单个英文单词过长导致CRF++出错的问题
- 修正了Trie结构的一个bug,现在32位和64位系统上可以共用同一个Trie字典了。(由于字典格式的改变用户需要重新build已有的字典)
- 修正了当libbamboo被当作shared library引用时,会出现symbol not found的问题
- 修正了maxforward分词方法不能正常工作的问题
2008-12-19 - 分词配置文件中use_break, use_single_combine, use_maxforward_combine选项现在可以正常工作了
- 修正了一个因为缺少字典而导致PostgreSQL崩溃的Bug
2008-12-08 - 经过weibingzheng同学的不懈努力,bamboo现在可以很好的进行命名实体的识别了。这些实体包括:人名,地名和机构名称。在此感谢weibingzheng同学的辛勤工作。
- 同时bingzheng同学还给bamboo带来的关键词抽取模块kea
- 根据ifengle同学的建议,我重构了bamboo的C++接口。新的接口使用factory模式来创建用于各种用途的解释器。包括:crf_seg(crf分词), keyword(关键词提取), crf_ner_ns(crf地名提取),.....
- 根据ifengle同学的建议,我们一起规范了所有的配置文件和文件中配置项的命名。
- 为postgresql增加了关键词抽取的接口
- prepare_processor中无法分离连续两个标点的问题被修正了(blame me!)
- 修正了trie字典不能正确处理\r的问题。(感谢bingzheng的提醒)
- perl的扩展被放到了unstable中。(我们的确需要一个了解xs的同学能帮帮我们)
- 特别感谢ifengle同学重写了许多文档,更详细地描述了bamboo的许多细节
2008-10-27 - bamboo现在有能力进行词性标注了。
- Bamboo现在有能力进行命名实体的识别了,其中包括人名,地名和机构名。
- Bamboo现在有能力识别各种英文标识符了,例如: UA-1234-5678, F-15,等等
- CRF有专有的训练脚本了,您再也不用劳神去研究如果Build一个CRF2的模型了
- 我们努力让配置文件更加具有可读性和灵活性,虽然还有很多工作需要继续完成。
- 很多让人头疼的Bug被修正了。
- 改变了PHP,PostgreSQL的扩展程序结构,现在他们可以运行得更快了。
2008-10-08 2008-09-28 - 使用自制的山寨版simple_config代替lua进行配置,今后bamboo将不再依赖于liublua了。
- 对代码进行了大量的优化,速度提高5倍之多。
- 新版本的auto_build程序,不再需要用户自己下载语料库。该程序会自动链接code.google.com下载。
- 在auto_build中加入了CRF模型训练的代码
|