scrapy爬虫-scrapy-redis分布式_scrapy redis增量爬虫

作者：小编更新时间：2023-08-13 07:56:20 浏览量：18人看过

scrapy爬虫-scrapy-redis分布式_scrapy redis增量爬虫-图1

①.、如何将一个scrapy爬虫项目修改成为一个简单的分布式爬虫项目

官方文档：https://scrapy-redis.readthedocs.io/en/stable/

只用修改scrapy项目的两个文件就可以了

 scrapy
from scrapy_redis.spiders import RedisSpider


# 自定义爬虫类的继承类不再是scrapy.spiders下面的爬虫类,
# 而是scrapy-redis.spiders下面的爬虫类
class DistributedSpiderSpider(RedisSpider):
name = 'distributed_spider'
allowed_domains = ['wh.lianjia.com']
# 将start_urls替换为redis_key
# start_urls = ['https://wh.lianjia.com/ershoufang/']

另一个是设置文件（settings.py）:

在设置文件中添加几个设置项就可以了

SCHEDULER = "scrapy_redis.scheduler.Scheduler" # hash + set DUPEFILTER_CLASS = "scrapy_redis.dupefilter.RFPDupeFilter" ITEM_PIPELINES = { 'DistributedSpider.pipelines.DistributedspiderPipeline': 300, 'scrapy_redis.pipelines.RedisPipeline': 400 } REDIS_HOST = "localhost" # 要连接的redis数据库的地址 REDIS_PORT = "6379" # redis数据库启动时的默认端口
# 默认是db0(redis有16个数据库,从db0~db15
# 如果远程redis数据库设置了密码,需要加下面一项
REDIS_PARAMS = {
　　"password": "********"
}

以上就是土嘎嘎小编为大家整理的scrapy爬虫-scrapy-redis分布式相关主题介绍,如果您觉得小编更新的文章只要能对粉丝们有用,就是我们最大的鼓励和动力,不要忘记讲本站分享给您身边的朋友哦！！

##################部分内容隐藏限制##################

浏览当前隐藏内容需要支付【0.00RNB】

购买查看完整文章

登录/购买

版权声明：倡导尊重与保护知识产权。未经许可，任何人不得复制、转载、或以其他方式使用本站《原创》内容，违者将追究其法律责任。本站文章内容，部分图片来源于网络，如有侵权，请联系我们修改或者删除处理。

相关推荐

linux命令上一页

java日记本源代码

如何从oracle抽数据

mysql应该怎么学习

java简单小项目源代码

python函数最小值

MySQL如何指定字符集和排序规则？_mysql字符集和排序规则怎么设置

django创建简单的页面响应实例教程

学习python之编写简单简单连接数据库并执行查询操作

MongoDB与MySQL的操作对比表及区别介绍

oracle怎么查重

oracle怎么存生僻字

linux重启命令区别

Visual_Studio_Code搭建django项目的方法步骤

怎么给java代码打包

php解密js数据加密_php数据加密解密函数

编辑推荐

1chrome web store

2易语言变量地址转换为变量源码分享

3BUTTONONCLICK点击以及异常解决方法

4date.plusday介绍

5python火柴人游戏代码

6ftp反向代理配置，frps反向代理设置方法

7完全背包问题python

8重启iis命令,iis停止命令

9php 多线程和队列有啥区别

10CSS实现立体字的效果

1PHPRunner下载_生成PHP代码的Windows应用程序

2AppNode-Linux服务器集群管理系统

3天宇加速器下载

4VB6防破解之金蝉脱壳防LOADER源码分享

5土嘎嘎Post推送调试工具V1.2

6海纳百川下载器

7Image转换为HTML工具 v1.0.0.5 免费版_tpzhtml图片转HTML工具

8夜鹰海盗盟反文件捆绑器V2.4

9易语言5.93完全版下载(包括知识库、多媒体教程)

10夜鹰海盗盟http代理检测工具_http代理测试软件下载

热门文章

1夜鹰海盗盟android反编译教程

2vb字符串截取代码大全

3php截取网页代码某个部分

网站首页

视频教程

下载频道

文章中心

问答中心

在线工具

scrapy爬虫-scrapy-redis分布式_scrapy redis增量爬虫

相关推荐

编辑推荐

热门文章