Jh Scrapyd

A preemptive scrapyd cluster built using Redis queues

Free software: MIT license (including the work distributed under the Apache 2.0 licenWHEELse)
Documentation: https://scrapyd.readthedocs.org/en/latest/

Installation

scrapyd >= 1.4.3

Install with pip from PyPI:

pip install jh_scrapyd

Configuration

editor scrapyd.conf

[scrapyd]
jobs_to_keep  = 20000
# Finished task queue
jobstorage    = scrapyd.jobstorage.SqliteJobStorage

# Scrapy main application
application   = jh_scrapyd.app.application

# Queue system, queue related management
spiderqueue   = jh_scrapyd.spiderqueue.JsonRedisPriorityQueue

# Web page management root
webroot       = jh_scrapyd.website.Root
[services]
# Cancel queue task
cancel.json   = jh_scrapyd.webservice.JhCancel

[jh_scrapyd]
# Preemptive cluster debugging mode
is_debug = 1

# Add Redis to configure celarclear
host = 127.0.0.1
password = 
port = 6379
db = 0

# Is there a unified queue (mainly used for different projects to share queue priority)
is_unified_queue = 1

# Queue prefix
queue_prefix = jh_scrapyd

# Number of pending tasks on the page, -1 Display all
tab_pending_count = 100

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
common		common
README.md		README.md
__init__.py		__init__.py
app.py		app.py
poller.py		poller.py
requirements.txt		requirements.txt
scheduler.py		scheduler.py
spiderqueue.py		spiderqueue.py
webservice.py		webservice.py
website.py		website.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Jh Scrapyd

Installation

Configuration

About

Releases

Packages

Languages

mrye5869/jh_scrapyd

Folders and files

Latest commit

History

Repository files navigation

Jh Scrapyd

Installation

Configuration

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages