Python如何爬取网页中js添加的内容 (代码)


当前第2页 返回上一页

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

import sys

from PyQt4.QtWebKit import *

from PyQt4.QtGui import *

from PyQt4.QtCore import *

 

class Render(QWebPage):  # 用来渲染网页,将url中的所有信息加载下来并存到一个新的框架中

    def __init__(self,url):

        self.app = QApplication(sys.argv)

        QWebPage.__init__(self)

        self.loadFinished.connect(self._loadFinished)

        self.mainFrame().load(QUrl(url))

        self.app.exec_()

    def _loadFinished(self, result):

        self.frame = self.mainFrame()

        self.app.quit()

 

url = 'http://jandan.net/ooxx'

r = Render(url)

html = r.frame.toHtml()

print(html)

那么,后面的工作就是解析HTML代码了,这里不做讲解。

以上就是Python如何爬取网页中js添加的内容 (代码)的详细内容,更多文章请关注木庄网络博客!!

返回前面的内容

相关阅读 >>

Python全局变量和局部变量的区别

Python删除list中的重复元素

Python需要学linux吗

Python怎么下载os库

Python中如何对字典排序

Python中eval的用法详解及潜在风险介绍

Python中filecmp的简单使用

Python中web框架(flask)的详解(代码示例)

Python中怎么删除列表中的元素

Python不能做什么

更多相关阅读请进入《Python》频道 >>




打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...