搜文章
推荐 原创 视频 Java开发 iOS开发 前端开发 JavaScript开发 Android开发 PHP开发 数据库 开发工具 Python开发 Kotlin开发 Ruby开发 .NET开发 服务器运维 开放平台 架构师 大数据 云计算 人工智能 开发语言 其它开发
Lambda在线 > DeveloperPython > 送给人类的 HTML 解析库

送给人类的 HTML 解析库

DeveloperPython 2018-02-28

阅读本篇预计需要 2 分钟

关注我比较早的读者,应该知道我分享过一系列关于 Requests 库的文章。其实这个 Python 库的作者 kennethreitz 也是一个重点,简直就是 Python 届的男神。

不清楚的可以看下这篇

也就在前天他又开源了一个项目 requests-html,和之前的 Requests 一样介绍语还是那么霸气:

HTML Parsing for Humans

简单的说,requests-html 是一个解析 html 的 Python 第三方库。同时它支持 CSS 选择器、XPath、Mock UA、自动进行重定向、连接池以及 Cookies。总之就是一个非常简单、实用的 HTMl 解析库。

了解 Requests 的读者应该知道,Kenn 开源的项目都有一个突出的亮点就是这些库都封装的很简单、以及特别实用。就像 Requests 是对 urllib、urllib3 的上层封装,大大的方便了我们平时的网络开发。

所以,不难猜出 requests-html 其实也是一个封装起来的组件库,内部核心则是 lxml 库等。

接下来就来看看这个库怎么用:

1. 安装

2. 使用

具体的使用文档,见下方链接:

https://github.com/kennethreitz/requests-html

版权声明:本站内容全部来自于腾讯微信公众号,属第三方自助推荐收录。《送给人类的 HTML 解析库》的版权归原作者「DeveloperPython」所有,文章言论观点不代表Lambda在线的观点, Lambda在线不承担任何法律责任。如需删除可联系QQ:516101458

文章来源: 阅读原文

相关阅读

关注DeveloperPython微信公众号

DeveloperPython微信公众号:dev_python

DeveloperPython

手机扫描上方二维码即可关注DeveloperPython微信公众号

DeveloperPython最新文章

精品公众号随机推荐