Python如何爬取网页中js添加的内容 (代码)


当前第2页 返回上一页

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

import sys

from PyQt4.QtWebKit import *

from PyQt4.QtGui import *

from PyQt4.QtCore import *

 

class Render(QWebPage):  # 用来渲染网页,将url中的所有信息加载下来并存到一个新的框架中

    def __init__(self,url):

        self.app = QApplication(sys.argv)

        QWebPage.__init__(self)

        self.loadFinished.connect(self._loadFinished)

        self.mainFrame().load(QUrl(url))

        self.app.exec_()

    def _loadFinished(self, result):

        self.frame = self.mainFrame()

        self.app.quit()

 

url = 'http://jandan.net/ooxx'

r = Render(url)

html = r.frame.toHtml()

print(html)

那么,后面的工作就是解析HTML代码了,这里不做讲解。

以上就是Python如何爬取网页中js添加的内容 (代码)的详细内容,更多文章请关注木庄网络博客!!

返回前面的内容

相关阅读 >>

Python用户验证怎么弄

如何用Python搭建匿名代理池?搭建匿名代理池的方法

Python中time模块求程序运行时间的方法实例分享

Python如何批量提取win10锁屏壁纸

Python如何安装urllib2库

Python 装饰器

Python使用正则表达式实现搜索单词的示例代码

调试设置中的Python路径无效怎么办

Python中常见工厂函数用法详解

Python序列循环移位的3种方法

更多相关阅读请进入《Python》频道 >>




打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...