设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客

基于HTTP协议的开源中文分词系统httpcws 1.0发布

2009-8-12 01:42| 发布者: walkerxk| 查看: 3950| 评论: 1

HTTPCWS是一款Linux下的基于HTTP协议的开源中文分词系统,采用BSD协议。 根据作者的介绍,这个分词系统是对中国科学院计算技术研究所免费提供的 ICTCLAS 3.0 共享版分词后的结果,再采用逆向最大匹配算法,根据作者自己补充的一个9万条词语的自定义词库,对ICTCLAS分词结果进行合并处理,输出最终分词结果。目前只支持GBK编码。 作者测试,局域网内 HTTPCWS 接口中文分词平均处理速度(Wait时间):0.001秒,每秒可处理5000~20000次请求。(演示地址

酷毙

雷人

鲜花

鸡蛋

漂亮
  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部