设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 业界资讯 软件追踪 查看内容

WebMagic 0.5.3版本发布,Java爬虫框架

2016-1-24 13:07| 发布者: joejoe0332| 查看: 420| 评论: 0|原作者: oschina|来自: oschina

摘要: 时隔一年半,作者终于回归了。这个版本主要解决之前的一些BUG,后续会慢慢的继续完善功能。升级Xsoup到0.3.1,支持//div语法。#245升级Jsoup到1.8.3,解决n-th selector二进制不兼容的问题。#139修复JsonFilePipelin ...

时隔一年半,作者终于回归了。这个版本主要解决之前的一些BUG,后续会慢慢的继续完善功能。

  • 升级Xsoup到0.3.1,支持//div[contains(@id,'te')]语法。

  • #245 升级Jsoup到1.8.3,解决n-th selector二进制不兼容的问题。

  • #139 修复JsonFilePipeline保存路径的问题

  • #144 修复@TargetUrl增加SourceRegion后取不到链接的问题

  • #157 修复FileCacheQueueScheduler中去重偶尔不工作的问题 @zhugw

  • #188 增加重试的间隔时间,默认为1秒 @edwardsbean

  • #193 修复分页功能MultiPagePipeline可能出现的并发问题 edwardsbean

  • #198 修正site.setHttpProxy()不起作用的bug @okuc


酷毙

雷人

鲜花

鸡蛋

漂亮
  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部