本文摘自php中文网,作者不言,侵删。
本篇文章给大家介绍的是Python爬虫之lxml-etree和xpath的结合使用(附案例),内容很详细,希望可以帮助到大家。
lxml:python 的HTML/XML的解析器
官网文档:https://lxml.de/
使用前,需要安装安 lxml 包
功能:
1.解析HTML:使用 etree.HTML(text) 将字符串格式的 html 片段解析成 html 文档
2.读取xml文件
3.etree和XPath 配合使用
lxml 的安装
【PyCharm】>【file】>【settings】>【Project Interpreter】>【+】 >【lxml】>【install】
具体操作截图:
lxml-etree 的使用
案例v25文件:https://xpwi.github.io/py/py%E7%88%AC%E8%99%AB/py25etree.py
用 lxml 来解析HTML代码
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 |
|
运行结果
lxml-etree 的使用
案例v26etree2文件:https://xpwi.github.io/py/py%E7%88%AC%E8%99%AB/py26etree2.py
读取xml文件:
1 2 3 4 5 6 |
|
运行结果
etree和XPath 配合使用
案例v26expath.文件:https://xpwi.github.io/py/py%E7%88%AC%E8%99%AB/py26expath.py
etree和XPath 配合使用:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
|
运行结果
etree和XPath 配合使用结果
相关推荐:
python爬虫之xpath的基本使用详解
python爬虫是什么?为什么把python叫做爬虫?
以上就是Python爬虫之lxml-etree和xpath的结合使用(附案例)的详细内容,更多文章请关注木庄网络博客!!
相关阅读 >>
更多相关阅读请进入《Python》频道 >>

Python编程 从入门到实践 第2版
python入门书籍,非常畅销,超高好评,python官方公认好书。