Skip to content

Releases: SculptTechProject/GinioCrawler

v0.1.0

11 Aug 22:31

Choose a tag to compare

🚀 GinioCrawler v0.1.0 – pierwszy publiczny build
Lekka apka desktopowa (Tkinter) do szybkiego zbierania leadów: szuka stron z Google (SerpAPI), wchodzi na witryny, wyciąga e-maile/telefony i zapisuje wynik do CSV oraz Excel (z aktywnymi linkami).

✨ Najważniejsze
🔎 Wyszukiwanie przez SerpAPI (PL, hl=pl, num=25)

🕷️ Asynchroniczny crawling (httpx) + respektowanie robots.txt

📬 Ekstrakcja e-maili i polskich numerów telefonów

🧭 Wykrywanie i doglądanie podstron Kontakt

📄 Eksport:

wyniki/csv/wyniki_YYYYMMDD_HHMMSS.csv (UTF-8-SIG, wygodne dla Excela)

wyniki/excel/wyniki_YYYYMMDD_HHMMSS.xlsx (zamrożony nagłówek, filtr, autoszerokości, hiperlinki)

🧹 Dedup na podstawie (zestaw e-maili, URL)

🖥️ GUI: wpisz frazę, wybierz folder wyjściowy, Start – po zakończeniu otwiera folder z Excelem

🧪 Jakość / CI
GitHub Actions: lint + testy (headless Tk, xvfb)

Auto-format: black + isort (auto-commit w PR)

Testy jednostkowe: parsowanie, sieć (mock httpx/respx), zapis CSV/XLSX, logika GUI

🛠 Jak używać (30 sekund)
Pobierz plik EXE z sekcji Assets poniżej.

Uruchom. Przy pierwszym starcie podaj SERPAPI_KEY (zapisze się do %APPDATA%/GinioCrawler/.env).

Wpisz frazę → wybierz folder → Start.
Po zakończeniu otworzy się folder z Excelem.

⚠️ Wymagania
Windows 10/11 (x64)

Klucz SerpAPI (SERPAPI_KEY) – darmowy plan wystarczy na testy

🔎 Znane ograniczenia
Jakość wyników zależy od SerpAPI (limity/kwoty).

Część stron może blokować boty; crawler respektuje robots.txt.