Python如何爬取网页中js添加的内容（代码）

2021-10-06 03:57:31 php中文网 Python 百度已收录

当前第2页返回上一页

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

import sys
from PyQt4.QtWebKit import *
from PyQt4.QtGui import *
from PyQt4.QtCore import *
 
class Render(QWebPage):  # 用来渲染网页,将url中的所有信息加载下来并存到一个新的框架中
    def __init__(self,url):
        self.app = QApplication(sys.argv)
        QWebPage.__init__(self)
        self.loadFinished.connect(self._loadFinished)
        self.mainFrame().load(QUrl(url))
        self.app.exec_()
    def _loadFinished(self, result):
        self.frame = self.mainFrame()
        self.app.quit()
 
url = 'http://jandan.net/ooxx'
r = Render(url)
html = r.frame.toHtml()
print(html)

那么，后面的工作就是解析HTML代码了，这里不做讲解。

以上就是Python如何爬取网页中js添加的内容（代码）的详细内容，更多文章请关注木庄网络博客！！

返回前面的内容

相关阅读 >>

Python全局变量和局部变量的区别

Python删除list中的重复元素

学Python需要学linux吗

Python怎么下载os库

Python中如何对字典排序

Python中eval的用法详解及潜在风险介绍

Python中filecmp的简单使用

Python中web框架(flask)的详解（代码示例）

Python中怎么删除列表中的元素

Python不能做什么

更多相关阅读请进入《Python》频道 >>

Python编程从入门到实践第2版

书籍

Python编程从入门到实践第2版

￥69.8元 人民邮电出版社

python入门书籍，非常畅销，超高好评，python官方公认好书。

转载请注明出处：木庄网络博客 » Python如何爬取网页中js添加的内容（代码）

标签：Python

木庄网络博客

感谢您的支持，我会继续努力的!

扫码支持

扫码打赏，您说多少就多少

支付宝

打开支付宝扫一扫，即可进行扫码打赏哦

分享从这里开始，精彩与您同在

相关推荐

评论

管理员已关闭评论功能...

欢迎访问木庄网络博客
可复制：代码框内的文字。
方法：Ctrl+C。