Парсер для сайта Alkoteka.com

Этот проект представляет собой парсер для сайта Alkoteka.com, реализованный с использованием фреймворка Scrapy. Парсер собирает информацию о товарах с сайта и сохраняет её в формате JSON.

🔍 Возможности

📦 Сбор данных о товарах (название, цена, описание и т.д.)
🔄 Ротация прокси для обхода антипарсинговых защит
🕶️ Генерация случайных User-Agent для каждого запроса
⏳ Настройка задержки между запросами
💾 Сохранение результатов в JSON-файл

🚀 Установка

1. Клонируйте репозиторий:

git clone https://github.com/drxxmy/alkoteka-scraper.git
cd alkoteka-scraper

2. Установите зависимости с помощью uv:

uv sync

⚡ Запуск парсер

Для запуска парсера выполните следующую команду:

scrapy crawl alkoteka -O result.json

📌 Результаты будут сохранены в файл result.json в корневой директории проекта.

⚙️ Конфигурация

Настройки парсера можно изменить в файле settings.py:

# При необходимости отредактируйте путь к файлу с прокси
ROTATING_PROXY_LIST_PATH = "proxy_list.txt"

# Задержка между запросами
DOWNLOAD_DELAY = 2

# Настройки Autothrottle
AUTOTHROTTLE_ENABLED = True
AUTOTHROTTLE_START_DELAY = 5
AUTOTHROTTLE_MAX_DELAY = 60
AUTOTHROTTLE_TARGET_CONCURRENCY = 1.0
AUTOTHROTTLE_DEBUG = True

📂 Структура проекта

├── pyproject.toml
├── README.md
├── scraper
│   ├── proxy_list.txt
│   ├── scraper
│   │   ├── __init__.py
│   │   ├── items.py
│   │   ├── middlewares.py
│   │   ├── pipelines.py
│   │   ├── settings.py
│   │   ├── spiders
│   │   │   ├── alkoteka.py
│   │   │   ├── __init__.py
│   │   └── utils.py
│   └── scrapy.cfg
└── uv.lock

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
scraper		scraper
.gitignore		.gitignore
.python-version		.python-version
README.md		README.md
pyproject.toml		pyproject.toml
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Парсер для сайта Alkoteka.com

🔍 Возможности

🚀 Установка

1. Клонируйте репозиторий:

2. Установите зависимости с помощью uv:

⚡ Запуск парсер

⚙️ Конфигурация

📂 Структура проекта

About

Uh oh!

Contributors

Uh oh!

Languages

drxxmy/alkoteka-scraper

Folders and files

Latest commit

History

Repository files navigation

Парсер для сайта Alkoteka.com

🔍 Возможности

🚀 Установка

1. Клонируйте репозиторий:

2. Установите зависимости с помощью uv:

⚡ Запуск парсер

⚙️ Конфигурация

📂 Структура проекта

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Contributors

Uh oh!

Languages