python爬虫需要调用什么模块


本文摘自php中文网,作者尚,侵删。

python 爬虫常用模块:

相关推荐:python爬虫库以及相关利器

Python标准库——urllib模块

功能:打开URL和http协议之类

注:python 3.x中urllib库和urilib2库合并成了urllib库。 其中urllib2.urlopen()变成了urllib.request.urlopen(),urllib2.Request()变成了urllib.request.Request()

urllib请求返回网页

urllib.request.urlopen

1

urllib.request.open(url[,data,[timeout,[cafile,[capth[,cadefault,[context]]]]]])

urllib.requset.urlioen可以打开HTTP(主要)、HTTPS、FTP、协议的URL

ca 身份验证

data 以post方式提交URL时使用

url 提交网络地址(全程 前端需协议名 后端需端口 http:/192.168.1.1:80)

timeout 超时时间设置

函数返回对象有三个额外的方法

geturl() 返回response的url信息

常用与url重定向info()返回response的基本信息

getcode()返回response的状态代码

示例:

阅读剩余部分

相关阅读 >>

mod在Python中怎么用

Python教程之select模块介绍

Python内置变量的一个例子

Python如何编出爱心

Python求平均值

Python中的def是什么意思

中谷教育Python视频教程资源推荐

Python的选择语句是什么语句

什么是Python的注释符

Python3学习之异常处理及文件的各种操作

更多相关阅读请进入《Python》频道 >>




打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...