阅读本篇预计需要 2 分钟
关注我比较早的读者,应该知道我分享过一系列关于 Requests 库的文章。其实这个 Python 库的作者 kennethreitz 也是一个重点,简直就是 Python 届的男神。
不清楚的可以看下这篇
也就在前天他又开源了一个项目 requests-html,和之前的 Requests 一样介绍语还是那么霸气:
HTML Parsing for Humans™
简单的说,requests-html 是一个解析 html 的 Python 第三方库。同时它支持 CSS 选择器、XPath、Mock UA、自动进行重定向、连接池以及 Cookies。总之就是一个非常简单、实用的 HTMl 解析库。
了解 Requests 的读者应该知道,Kenn 开源的项目都有一个突出的亮点就是这些库都封装的很简单、以及特别实用。就像 Requests 是对 urllib、urllib3 的上层封装,大大的方便了我们平时的网络开发。
所以,不难猜出 requests-html 其实也是一个封装起来的组件库,内部核心则是 lxml 库等。
接下来就来看看这个库怎么用:
1. 安装
2. 使用
具体的使用文档,见下方链接:
https://github.com/kennethreitz/requests-html
版权声明:本站内容全部来自于腾讯微信公众号,属第三方自助推荐收录。《送给人类的 HTML 解析库》的版权归原作者「DeveloperPython」所有,文章言论观点不代表Lambda在线的观点, Lambda在线不承担任何法律责任。如需删除可联系QQ:516101458
文章来源: 阅读原文
DeveloperPython微信公众号:dev_python
手机扫描上方二维码即可关注DeveloperPython微信公众号