Python使用四种方法实现获取当前页面内所有链接的对比分析


当前第2页 返回上一页

1

2

3

4

5

6

7

8

9

10

11

12

# 再打开所有iframe查找全部的a标签

for iframe in soup.find_all('iframe'):

  url_ifr = iframe['src'] # 取得当前iframe的src属性值

  rr = requests.get(url_ifr)

  rr.encoding = 'gb2312'

  soup_ifr = BeautifulSoup(rr.text,'lxml')

  for a in soup_ifr.find_all('a'):

    link = a['href']

    m = re.match(r'http:\/\/.*?(?=\/)',link)

    #print(link)

    if m:

      all_urls.add(m.group(0))

以上就是Python使用四种方法实现获取当前页面内所有链接的对比分析的详细内容,更多文章请关注木庄网络博客!!

返回前面的内容

相关阅读 >>

Python的tornado之websocket的概念以及应用介绍

Python中header是什么意思

vs可以写Python

剖析Python垃圾回收机制

Python怎么读写excel

Python开发tornado网站之requesthandler:接入点函数

ipad上可以运行Python

Python爬虫有什么用

Python中time模块需要安装么

Python中如何从列表中删除none值

更多相关阅读请进入《Python》频道 >>




打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...