设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 业界资讯 软件追踪 查看内容

Scrapy 1.2.2发布,Web爬虫框架

2016-12-7 22:10| 发布者: joejoe0332| 查看: 538| 评论: 0|原作者: oschina|来自: oschina

摘要: Scrapy 1.2.2 发布了。 Scrapy 是一套基于基于Twisted的异步处理框架,纯python实现的爬虫框架,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片。 更新内容: Bug 修复 ...

Scrapy 1.2.2 发布了。

Scrapy 是一套基于基于Twisted的异步处理框架,纯python实现的爬虫框架,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片。

更新内容:

Bug 修复

  • Fix a cryptic traceback when a pipeline fails on open_spider() (issue 2011)

  • Fix embedded IPython shell variables (fixing issue 396 that re-appeared in 1.2.0, fixed in issue 2418)

  • A couple of patches when dealing with robots.txt:

    • handle (non-standard) relative sitemap URLs (issue 2390)

    • handle non-ASCII URLs and User-Agents in Python 2 (issue 2373)

文档

其他变更

  • Advertize conda-forge as Scrapy’s official conda channel (issue 2387)

  • More helpful error messages when trying to use .css() or .xpath() on non-Text Responses (issue 2264)

  • startproject command now generates a sample middlewares.py file (issue 2335)

  • Add more dependencies’ version info in scrapy version verbose output (issue 2404)

  • Remove all *.pyc files from source distribution (issue 2386)

完整更新内容

下载地址


酷毙

雷人

鲜花

鸡蛋

漂亮
  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部