本文摘自php中文网,作者不言,侵删。
本篇文章给大家带来的内容是关于Python模拟微博登陆的方法介绍(附代码),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。
今天想做一个微博爬个人页面的工具,满足一些不可告人的秘密。那么首先就要做那件必做之事!模拟登陆……
我对代码进行了优化,重构成了Python 3.6 版本,并且加入了大量注释方便大家学习。
PC 登录新浪微博时, 在客户端用js预先对用户名、密码都进行了加密, 而且在POST之前会GET 一组参数,这也将作为POST_DATA 的一部分。 这样, 就不能用通常的那种简单方法来模拟POST 登录( 比如 人人网 )。
1、在提交POST请求之前, 需要GET 获取两个参数。
地址是:
http://login.sina.com.cn/sso/login.php?client=ssologin.js(v1.3.18)
得到的数据中有 servertime 和 nonce 的值, 是随机的,其他值貌似没什么用。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | def get_servertime():
url = 'http://login.sina.com.cn/sso/prelogin.php?entry=weibo&callback=sinaSSOController.preloginCallBack&su=dW5kZWZpbmVk&client=ssologin.js(v1.3.18)&_=1329806375939'
# 返回出来的是一个Response对象,无法直接获取,text后,可以通过正则匹配到
# 大概长这样子的:sinaSSOController.preloginCallBack({ "retcode" :0, "servertime" :1545606770, ...})
data = requests.request( 'GET' , url).text
p = re.compile( '\((.*)\)' )
try :
json_data = p.search(data).group(1)
data = json.loads(json_data)
servertime = str(data[ 'servertime' ])
nonce = data[ 'nonce' ]
return servertime, nonce
except:
print ( '获取 severtime 失败!' )
return None
|
2、通过httpfox 观察POST 的数据, 参数较复杂,其中 “su" 是加密后的username, sp 是加密后的password。servertime 和 nonce 是上一步得到的。其他参数是不变的。
username 经过了BASE64 计算:
1 | username = base64.encodestring( urllib.quote(username) )[:-1]
|
password 经过了三次SHA1 加密, 且其中加入了 servertime 和 nonce 的值来干扰。
即: 两次SHA1加密后, 将结果加上 servertime 和 nonce 的值, 再SHA1 算一次。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 | def get_pwd(pwd, servertime, nonce):
# 第一次计算,注意Python3 的加密需要encode,使用bytes
pwd1 = hashlib.sha1(pwd.encode()).hexdigest()
# 使用pwd1的结果在计算第二次
pwd2 = hashlib.sha1(pwd1.encode()).hexdigest()
# 使用第二次的结果再加上之前计算好的servertime和nonce值,hash一次
pwd3_ = pwd2 + servertime + nonce
pwd3 = hashlib.sha1(pwd3_.encode()).hexdigest()
return pwd3
def get_user(username):
# 将@符号转换成url中能够识别的字符
_username = urllib.request.quote(username)
# Python3中的base64计算也是要字节
# base64出来后,最后有一个换行符,所以用了切片去了最后一个字符
username = base64.encodebytes(_username.encode())[:-1]
return username
|
3、将参数组织好, POST请求。 这之后还没有登录成功。
POST后得到的内容中包含一句:
1 | location.replace( "http://weibo.com/ajaxlogin.php?framelogin=1&callback=parent.sinaSSOController.feedBackUrlCallBack&retcode=101&reason=%B5%C7%C2%BC%C3%FB%BB%F2%C3%DC%C2%EB%B4%ED%CE%F3" )
|
这是登录失败时的结果, 登录成功后结果与之类似, 不过retcode 的值是0 。
接下来再请求这个URL,这样就成功登录到微博了。
记得要提前build 缓存。

以上就是Python模拟微博登陆的方法介绍(附代码)的详细内容,更多文章请关注木庄网络博客!!
相关阅读 >>
如何输出到stderr
Python引用计数与弱引用的简单了解(附实例)
如何在Python中使用运算符?(代码实例)
Python如何使用learning_curve
如何获取一个文件的创建和修改时间
详解Python函数之map,filter,reduce
详解Python中and和or的返回值
Python3怎么安装库
Python采集--数据的储存
Python递归求阶乘的方法
更多相关阅读请进入《Python》频道 >>
人民邮电出版社
python入门书籍,非常畅销,超高好评,python官方公认好书。
转载请注明出处:木庄网络博客 » Python模拟微博登陆的方法介绍(附代码)