Releases: SculptTechProject/GinioCrawler
v0.1.0
🚀 GinioCrawler v0.1.0 – pierwszy publiczny build
Lekka apka desktopowa (Tkinter) do szybkiego zbierania leadów: szuka stron z Google (SerpAPI), wchodzi na witryny, wyciąga e-maile/telefony i zapisuje wynik do CSV oraz Excel (z aktywnymi linkami).
✨ Najważniejsze
🔎 Wyszukiwanie przez SerpAPI (PL, hl=pl, num=25)
🕷️ Asynchroniczny crawling (httpx) + respektowanie robots.txt
📬 Ekstrakcja e-maili i polskich numerów telefonów
🧭 Wykrywanie i doglądanie podstron Kontakt
📄 Eksport:
wyniki/csv/wyniki_YYYYMMDD_HHMMSS.csv (UTF-8-SIG, wygodne dla Excela)
wyniki/excel/wyniki_YYYYMMDD_HHMMSS.xlsx (zamrożony nagłówek, filtr, autoszerokości, hiperlinki)
🧹 Dedup na podstawie (zestaw e-maili, URL)
🖥️ GUI: wpisz frazę, wybierz folder wyjściowy, Start – po zakończeniu otwiera folder z Excelem
🧪 Jakość / CI
GitHub Actions: lint + testy (headless Tk, xvfb)
Auto-format: black + isort (auto-commit w PR)
Testy jednostkowe: parsowanie, sieć (mock httpx/respx), zapis CSV/XLSX, logika GUI
🛠 Jak używać (30 sekund)
Pobierz plik EXE z sekcji Assets poniżej.
Uruchom. Przy pierwszym starcie podaj SERPAPI_KEY (zapisze się do %APPDATA%/GinioCrawler/.env).
Wpisz frazę → wybierz folder → Start.
Po zakończeniu otworzy się folder z Excelem.
Windows 10/11 (x64)
Klucz SerpAPI (SERPAPI_KEY) – darmowy plan wystarczy na testy
🔎 Znane ograniczenia
Jakość wyników zależy od SerpAPI (limity/kwoty).
Część stron może blokować boty; crawler respektuje robots.txt.