| Projects on Google Code | Results 1 - 10 of 33 |
<b>小蜜蜂 抓呀抓~</b>
小蜜蜂分布式网页抓取系统<br>
划时代的网络分布式小蜜蜂抓取系统。
支持服务器广域分布,自动按ip分发,灵活扩展,自适应内存。
经过2年的完善,可以应用于各种应用:<br>
1,站内搜索<br>
2,关键词监控<br>
3,bbs抓取<br>
4,blog定制更新<br>
5,独立的网页分析系统<br>
6,灵活配置抓取过滤规则<br>
<br>
速度快,内存小,单机可以支持1000w/g内存的容量,<br>
由于单机监控的url过多,在对目标网站更新频率达到最高的情况下,会导致更新周期变长,<br>
推荐使用不超过...
这是成都理工大学校内搜索引擎项目。
下面子项目有:
# 网页搜索 普通的网页搜索
# 新闻搜索 搜索校内里面所有的新闻
# FTP搜索 搜索校内三个FTP站点的文件
# 文档搜索 搜索学校里的所有文档
预计在10月份正式上线。
正在紧张开发中,敬请期待...
soman2很容易使用,适合个人用户平时搜集网上信息使用,尤其是需要持续关注的信息。也适合中小企业、网站用于采集信息、更新数据。
ahkimkoo search engine.基于python的垂直搜索引擎
Email/MSN:successage@gmail.com
QQ:419117039
imdict-chinese-analyzer 是 [http://www.imdict.net/ imdict智能词典] 的智能中文分词模块,算法基于隐马尔科夫模型(Hidden Markov Model, HMM),是中国科学院计算技术研究所的[http://ictclas.org/ ictclas]中文分词程序的重新实现(基于Java),可以直接为lucene搜索引擎提供*简体中文*分词支持。
=Apache Lucene的中文分词=
[http://lucene.apache.org Apache Lucene]是java实现的一个高效的文本搜索引擎软件,它适用于几乎所有要求全...
信息检索
Looker可以把很多网站的新闻整合在一起,方便用户查看和搜寻。
Looker可以根据您的配置,自动的定时检查新闻站点的新闻更新,只要新闻站点的新闻一更新,Looker可以把更新的新闻下载到您的新闻数据库中,随时保持您的新闻数据库的完全和同步更新。
用户在您的网站上就可以看到几个网站上所有的新闻,免去了打开多个浏览器一个一个去查看新闻的麻烦。
还开放的RSS源,让用户更方便的查看新闻。
完整的索引系统,新闻的所有资源都可以搜索,比如图片,视频,文件都可以查找您想要的新闻。
只需简单的定义几个配置,您就可以开始您的新闻整合之旅了。
监视程序用JAVA开发,网页使用Th...
=概述=
百度专利搜索结果页面的元信息自动提取辅助工具,需要Firefox+Zotero的支持
新增对中国专利数据库检索系统的结果信息自动提取和保存的支持。
=安装方法=
zotero最新的是2.0beta版,也有1.0.x版。
如果是2.0版,只要把文件保存为baidu-zhuanli.js文件,放在zotero目录下的translators目录下,重启Firefox即可。
如果是1.0.x系列的版本,需要下载一个Firefox的scaffold插件,然后将文件的内容填入scaffold中对应的地方,保存后重启即可。其中,detectWeb函数是放在Detect ...
= 信景智能检索提示及纠错源码说明 =
智能检索提示是指当用户在浏览器的搜索栏中输入关键词的前部分内容时,服务器便对其可能的完整输入内容进行猜测,并显示在搜索栏下以便用户快速选择;同时,如果用户的输入存在错误,程序也会在允许范围内尝试纠错,最终返回给用户可能的正确结果。智能提示和纠错已经是一款成功的商业搜索引擎不可或缺的重要功能。本源码由广州信景技术有限公司开发发布,实现了智能检索提示的基本功能。在*_Source_*中您可以下载到整套工程原码,在*_Downloads_*中还有配套组件可供下载。了解更多更丰富的产品请登录:http://www.infoscape.com.cn/
...
=注:最新的分词系统 HTTPCWS 已经发布,用来取代 PHPCWS。=
=请点击以下网址下载 HTTPCWS:=
=http://code.google.com/p/httpcws=
=原来的 PHPCWS 停止更新。=
----
==Introduction in English==
PHPCWS is a open-source PHP Extension for Chinese Word Segmentation, using ICTCLAS Chinese word segmentation algorithms and Reverse maxi...