Python使用四种方法实现获取当前页面内所有链接的对比分析


当前第2页 返回上一页

1

2

3

4

5

6

7

8

9

10

11

12

# 再打开所有iframe查找全部的a标签

for iframe in soup.find_all('iframe'):

  url_ifr = iframe['src'] # 取得当前iframe的src属性值

  rr = requests.get(url_ifr)

  rr.encoding = 'gb2312'

  soup_ifr = BeautifulSoup(rr.text,'lxml')

  for a in soup_ifr.find_all('a'):

    link = a['href']

    m = re.match(r'http:\/\/.*?(?=\/)',link)

    #print(link)

    if m:

      all_urls.add(m.group(0))

以上就是Python使用四种方法实现获取当前页面内所有链接的对比分析的详细内容,更多文章请关注木庄网络博客!!

返回前面的内容

相关阅读 >>

Python中append的用法

Python属于开源语言吗

Python里print是什么意思

Python中next和send的用法介绍(代码)

Python实现在idle中输入多行的方法

Python launcher 可以卸载吗?

Python的调试;print()和断言(实例解析二)

Python中文叫什么

Python中简单统计量的计算

利用Python反向输出一个字符串

更多相关阅读请进入《Python》频道 >>




打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...