Python 网络爬虫--关于简单的模拟登录


本文摘自php中文网,作者不言,侵删。

今天这篇文章主要介绍了关于Python 网络爬虫--关于简单的模拟登录,有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下

和获取网页上的信息不同,想要进行模拟登录还需要向服务器发送一些信息,如账号、密码等等。

模拟登录一个网站大致分为这么几步:

1.先将登录网站的隐藏信息找到,并将其内容先进行保存(由于我这里登录的网站并没有额外信息,所以这里没有进行信息筛选保存)

2.将信息进行提交

3.获取登录后的信息

先给上源码

1

2

3

4

5

6

7

8

9

10

11

12

13

14

<span style="font-size: 14px;"># -*- coding: utf-8 -*-

import requests

def login():

 session = requests.session()

 # res = session.get('http://my.its.csu.edu.cn/').content

 login_data = {

 'userName':'3903150327',

 'passWord':'136510',

 'enter':'true'

 }

 session.post('http://my.its.csu.edu.cn//', data=login_data)

 res = session.get('http://my.its.csu.edu.cn/Home/Default')

 print(res.text)

login()</span>

一、筛选得到隐藏信息

进入开发者工具(按F12),找到其中的Network后,手动的先进行一次登录,找到其中的第一个请求,在Header的底部会有一个data的数据段,这个就是登录所需的信息。如果想对其中的隐藏信息进行修改

先获取网页Html的内容

1

res = session.get('http://my.its.csu.edu.cn/').content

再通过正则表达式筛选内容

Python 网络爬虫--关于简单的模拟登录

二、将信息进行提交

找到源码中提交表单所需要的action,和method

使用

1

session.post('http://my.its.csu.edu.cn/(这里就是提交的action)', data=login_data)

该方法提交信息

三、获取登录后的信息

信息提交后模拟登录就成功了

接下来就可以获取登录后的信息了

1

res = session.get('http://my.its.csu.edu.cn/Home/Default').content

相关推荐:

Python爬虫抓取代理IP并检验可用性的实例

Python爬虫浏览器标识库

以上就是Python 网络爬虫--关于简单的模拟登录的详细内容,更多文章请关注木庄网络博客!!

相关阅读 >>

Python字典增加删除键值的方法

Python中如何在一个函数中加入多个装饰器

Python基础环境搭建的方法(图文)

实例介绍Python随机数使用方法,推导以及字符串,双色球

Python怎么去重

怎么在Python开发界面

Python 3.7新功能之dataclass装饰器详解

从青铜到王者,进阶数据可视化2.0的五个Python库!

用户输入输出和while循环

Python使用pandas处理excel的方法

更多相关阅读请进入《Python》频道 >>




打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...