Python使用四种方法实现获取当前页面内所有链接的对比分析


当前第2页 返回上一页

1

2

3

4

5

6

7

8

9

10

11

12

# 再打开所有iframe查找全部的a标签

for iframe in soup.find_all('iframe'):

  url_ifr = iframe['src'] # 取得当前iframe的src属性值

  rr = requests.get(url_ifr)

  rr.encoding = 'gb2312'

  soup_ifr = BeautifulSoup(rr.text,'lxml')

  for a in soup_ifr.find_all('a'):

    link = a['href']

    m = re.match(r'http:\/\/.*?(?=\/)',link)

    #print(link)

    if m:

      all_urls.add(m.group(0))

以上就是Python使用四种方法实现获取当前页面内所有链接的对比分析的详细内容,更多文章请关注木庄网络博客!!

返回前面的内容

相关阅读 >>

Python生成随机数的方法_Python

Python防止sql注入方法介绍

Python ord()是什么?ord()有什么用?

Python中if 条件判断代码解析

Python字典的清单如何使用

Python编码用什么软件

如何在Python中使用运算符?(代码实例)

[flask/Python/web]学习flask web开发(miguel著)遇到的一些问题及其解决方案

Python为什么编码声明

如何查看Python版本

更多相关阅读请进入《Python》频道 >>




打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...