设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客

开源且可扩展的web爬虫项目:Heritrix

2007-8-13 16:52| 发布者: joejoe0332| 查看: 5017| 评论: 1

  Heritrix是一个开源,可扩展的web爬虫项目。Heritrix设计成严格按照robots.txt文件的排除指示和META robots标签。

  
http://crawler.archive.org/

酷毙

雷人

鲜花

鸡蛋

漂亮
  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部