本文整理自网络,侵删。
介绍
提到爬虫,互联网的朋友应该都不陌生,现在使用Python爬取网站数据是非常常见的手段,好多朋友都是爬取豆瓣信息为案例,我不想重复,就使用了爬取51cto博客网站信息为案例,这里以我的博客页面为教程,编写的Python代码!
实验环境
1.安装Python 3.7
2.安装requests, bs4模块
实验步骤
1.安装Python3.7环境
2.安装requests,bs4 模块
打开cmd,输入:pip install requests -i https://pypi.tuna.tsinghua.edu.cn/simple/
再安装bs4, 输入:pip install bs4 -i https://pypi.tuna.tsinghua.edu.cn/simple/
安装后面加上-i https://pypi.tuna.tsinghua.edu.cn/simple/ 表示从清华镜像下载模块,速度会提高好多!
相关阅读 >>
discuz 7.0伪静态rewrite的.htaccess规则
完美转换mysql的字符集 解决查看utf8源文件中的乱码问题
php 7安装使用体验之性能大提升,兼容性强,扩展支持不够(升级php要谨慎)
discuz免激活同步登入代码修改方法(discuz同步登录)
更多相关阅读请进入《Discuz论坛》频道 >>