Scrapy parser PEP

Описание

Парсер документов PEP с использованием фреймворка Scrapy. Scrapy — это высокоуровневый Python-фреймворк для парсинга данных с веб-сайтов, построенный на базе асинхронной библиотеки Twisted. В данном проекте парсер асинхронно проходится по сайту с документацией PEP и создаёт 2 файла в формате csv с данными и статистикой по ним.

Технологии в проекте

Scrapy 2.5.1, Twisted 22.2.0

Инструкция по запуску

Установите и активируйте виртуальное окружение.

python -m venv venv
source venv/Scripts/./activate

Обновите менеджер пакетов pip и установите зависимости.

python -m pip install --upgrade pip
pip install -r requirements.txt

Запустите парсер.

scrapy crawl pep

В дирректории results появятся 2 файла в формате csv: pep_ДатаВремя.csv - список с данными по номеру, названию и статусу каждого существующего pep. status_summary_ДатаВремя.csv - сводка по статусам PEP, сколько найдено документов в каждом статусе.

Автор

Семёнов Сергей (Github - bluesprogrammer-Python, telegram - seregabrat9)

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
pep_parse		pep_parse
results		results
.flake8		.flake8
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt
scrapy.cfg		scrapy.cfg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Scrapy parser PEP

Описание

Технологии в проекте

Инструкция по запуску

Автор

About

Uh oh!

Releases

Packages

Uh oh!

Languages

bluesprogrammer-Python/scrapy_parser_pep

Folders and files

Latest commit

History

Repository files navigation

Scrapy parser PEP

Описание

Технологии в проекте

Инструкция по запуску

Автор

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages