web spider开源框架:Arachnid

来源: LUPA开源社区
发布时间: 2007-08-13 17:42 作者: webmaster 来源: Java开源大全 版权申明

字体: | 上一篇 下一篇 | 打印


关键词: web爬虫

文章来源于http://www.lupaworld.com
  Arachnid:是一个基于Java的web spider框架.它包含一个简单的HTML剖析器能够分析包含HTML内容的输入流.通过实现Arachnid的子类就能够开发一个简单的Web spiders并能够在Web站上的每个页面被解析之后增加几行代码调用。 Arachnid的下载包中包含两个spider应用程序例子用于演示如何使用该框架。

  
http://arachnid.sourceforge.net/

  
文章来源于http://www.lupaworld.com

声明:LUPA开源社区刊登此文只为传递信息,并不表示赞同或者反对。

相关阅读:

查看全部评论(0)我来说两句 直接向LUPA提出您的宝贵建议

-5 -3 -1 - +1 +3 +5