安装完后先建立软链接
ln -s /usr/local/python3/bin/gerapy /usr/bin/gerapy
初始化
gerapy init
初始化数据库
cd gerapy gerapy migrate
报错sqllite 版本过低
解决办法:升级sqllite
下载 wget https://www.sqlite.org/2019/sqlite-autoconf-3300000.tar.gz --no-check-certificate tar -zxvf sqlite-autoconf-3300000.tar.gz
安装 mkdir /opt/sqlite cd sqlite-autoconf-3300000 ./configure --prefix=/opt/sqlite make && make install
建立软连接 mv /usr/bin/sqlite3 /usr/bin/sqlite3_old ln -s /opt/sqlite/bin/sqlite3 /usr/bin/sqlite3 echo “/usr/local/lib” > /etc/ld.so.conf.d/sqlite3.conf ldconfig vim ~/.bashrc 添加 export LD_LIBRARY_PATH=“/usr/local/lib” source ~/.bashrc
查看当前sqlite3的版本 sqlite3 --version
重新初始化gerapy 数据库
配置账密
gerapy createsuperuser
启动gerapy
gerapy runserver gerapy runserver 0.0.0.0:9000 # 外部访问 9000端口启动
由于没有启动scrapy 这里的主机未0
启动scrapyd后,配置scrapyd的主机信息
配置成功后就会加入到主机列表里
四、scrapy+scrapyd+gerapy的结合使用
4.1 创建scrapy项目
进到gerapy的项目目录
cd ~/gerapy/projects/
然后新建一个scrapy项目
scrapy startproject gerapy_test scrapy genspider baidu_test www.baidu.com
修改scrapy.cfg 如下
在使用scrapyd-deploy 上传到scrapyd,先建立软连接再上传
ln -s /usr/local/python3/bin/scrapyd-deploy /usr/bin/scrapyd-deploy scrapyd-deploy app -p gerapy_test
4.2 部署打包scrapy项目
然后再gerapy页面上可以看到我们新建的项目,再打包一下
运行之前还需修改下scrapy代码
修改完后再运行代码
4.3 运行
运行成功,本次的部署就ok了!
五、填坑
5.1 运行scrapy爬虫报错
解决办法:修改lzma源代码如下
try: from _lzma import * from _lzma import _encode_filter_properties, _decode_filter_properties except ImportError: from backports.lzma import * from backports.lzma import _encode_filter_properties, _decode_filter_properties
5.2 scrapyd 运行 scrapy 报错
解决办法:降低scrapy版本 pip3 install scrapy==2.5.1
到此这篇关于scrapy+scrapyd+gerapy 爬虫调度框架超详细教程的文章就介绍到这了,更多相关scrapy+scrapyd+gerapy 爬虫调度框架内容请搜索
标签:SQLite
相关阅读 >>
基于java实现一个简单的单词本android app的实践
更多相关阅读请进入《Sqlite》频道 >>

数据库系统概念 第6版
本书主要讲述了数据模型、基于对象的数据库和XML、数据存储和查询、事务管理、体系结构等方面的内容。