设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
Python的HTML解析器 Beautiful Soup

Beautiful Soup 库是一个非常神奇的 “粗糙的解析器”,用于解析实际 Web 页面中包含的有效 HTML。

示例:

from BeautifulSoup import BeautifulSoup
html = "<html><p>Para 1<p>Para 2<blockquote>Quote 1<blockquote>Quote 2"
soup = BeautifulSoup(html)
print soup.prettify()
# <html>
# <p>
# Para 1
# </p>
# <p>
# Para 2
# <blockquote>
# Quote 1
# <blockquote>
# Quote 2
# </blockquote>
# </blockquote>
# </p>
# </html>

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187

返回顶部