分布式相关
[ scrapy-redis 、 rq / celery 、ELK 、 ]
一、构建
1、爬虫:使用现有scrapy分布式框架scrapy-redis,主机生成任务分发到消息队列上,从机从消息队列消费业务
二、部署
1、使用Docker容器技术,把从机执行代码连同依赖环境装在容器上,在指定云主机等进行远程部署;最后按照自定义计划执行业务代码
2、moba → ssh的使用,修改config然后scp等方法
三、运维
通过日志转 Elastic Stack栈 调用观察
crawllab——————留坑
