Python如何爬取网页中js添加的内容 (代码)


当前第2页 返回上一页

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

import sys

from PyQt4.QtWebKit import *

from PyQt4.QtGui import *

from PyQt4.QtCore import *

 

class Render(QWebPage):  # 用来渲染网页,将url中的所有信息加载下来并存到一个新的框架中

    def __init__(self,url):

        self.app = QApplication(sys.argv)

        QWebPage.__init__(self)

        self.loadFinished.connect(self._loadFinished)

        self.mainFrame().load(QUrl(url))

        self.app.exec_()

    def _loadFinished(self, result):

        self.frame = self.mainFrame()

        self.app.quit()

 

url = 'http://jandan.net/ooxx'

r = Render(url)

html = r.frame.toHtml()

print(html)

那么,后面的工作就是解析HTML代码了,这里不做讲解。

以上就是Python如何爬取网页中js添加的内容 (代码)的详细内容,更多文章请关注木庄网络博客!!

返回前面的内容

相关阅读 >>

Python可以做什么

Python里d是什么意思

Python使用正则表达式实现搜索单词的示例代码

Python 里如何手工进行延迟

基于Python log 的正确打开方式

Python定制类__str__(实例详解)

Python如何实现可视化热力图

爬虫基本流程request和response的介绍

Python水仙花数的编程代码如何写

安装完Python后怎么用

更多相关阅读请进入《Python》频道 >>




打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...