Denne veiledningen dekker alt dere trenger for å komme i gang med workshopen på en ren Mac, Linux eller Windows-maskin.
Åpne Terminal og kjør:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"brew install python@3.13Verifiser installasjonen:
python3 --versioncurl -sSL https://install.python-poetry.org | python3 -Legg til Poetry i PATH (legg til i ~/.zshrc eller ~/.bash_profile):
export PATH="$HOME/.local/bin:$PATH"Last inn endringene:
source ~/.zshrc # eller source ~/.bash_profileVerifiser Poetry:
poetry --versionHva er gcloud CLI og bq?
Google Cloud CLI (gcloud) er kommandolinjeverktøyet for å jobbe med Google Cloud Platform. Det inkluderer bq-kommandoen som er spesifikt designet for BigQuery-operasjoner.
bq-kommandoen lar dere:
- Kjøre SQL-spørringer direkte fra terminalen (
bq query) - Administrere datasets og tabeller (
bq mk,bq ls,bq show) - Laste data til BigQuery (
bq load) - Eksportere data fra BigQuery (
bq extract)
Selv om dere kan bruke BigQuery Console (web UI) for alt, gjør bq mange oppgaver raskere og enklere å automatisere. I workshopen vil dere bruke både bq i terminalen og BigQuery Console i nettleseren.
brew install google-cloud-sdksudo apt update && sudo apt upgrade -ysudo apt install software-properties-common -y
sudo add-apt-repository ppa:deadsnakes/ppa -y
sudo apt update
sudo apt install python3.13 python3.13-venv python3.13-dev -yVerifiser:
python3 --versioncurl -sSL https://install.python-poetry.org | python3.13 -Legg til i PATH (~/.bashrc eller ~/.zshrc):
export PATH="$HOME/.local/bin:$PATH"Last inn:
source ~/.bashrcVerifiser:
poetry --versionHva er gcloud CLI og bq?
Google Cloud CLI (gcloud) er kommandolinjeverktøyet for å jobbe med Google Cloud Platform. Det inkluderer bq-kommandoen som er spesifikt designet for BigQuery-operasjoner.
bq-kommandoen lar dere:
- Kjøre SQL-spørringer direkte fra terminalen (
bq query) - Administrere datasets og tabeller (
bq mk,bq ls,bq show) - Laste data til BigQuery (
bq load) - Eksportere data fra BigQuery (
bq extract)
I workshopen vil dere bruke både bq i terminalen og BigQuery Console i nettleseren.
curl https://sdk.cloud.google.com | bash
exec -l $SHELLNB: For Windows-brukere anbefaler vi å bruke Windows Subsystem for Linux (WSL) hvis dere er komfortable med Linux. WSL gir en bedre utvikleropplevelse og gjør det enklere å følge workshop-instruksjonene. Hvis dere foretrekker native Windows, følg instruksjonene nedenfor.
- Last ned Python 3.13 fra python.org
- Kjør installasjonsprogrammet
- VIKTIG: Huk av "Add Python to PATH"
- Velg "Install Now"
Verifiser i PowerShell eller Command Prompt:
python --versionÅpne PowerShell som administrator og kjør:
(Invoke-WebRequest -Uri https://install.python-poetry.org -UseBasicParsing).Content | python -Legg til Poetry i PATH:
- Søk etter "Environment Variables" i Windows
- Rediger "Path" under "User variables"
- Legg til:
%APPDATA%\Python\Scripts
Restart PowerShell og verifiser:
poetry --versionLast ned og installer fra Google Cloud SDK
git clone git@github.com:kantega/loeft.git
cd loeftpoetry installDette installerer:
pandas(>=2.3.2) - Databehandlingpyarrow(>=21.0.0) - Parquet-støttegoogle-cloud-bigquery(>=3.11.0) - BigQuery-integrasjon
Generer et lite testsett med 100 rader:
poetry run python generate_sales_data.py --rows 100 --output testDere skal se en rapport som viser at 100 rader ble generert.
✅ Suksesskriterium: Kommandoen skal fullføre uten feil og vise en rapport med "Generated 100 rows".
📊 Se på testdataene:
Åpne filen som ble generert og se på de første linjene:
head -20 test.csv✅ Suksesskriterium: Dere skal se CSV-data med kolonner som product_id, product_name, sales_timestamp, sales_amount, payment_method.
💡 Reflekter over datakvaliteten:
Ta et øyeblikk for å se på dataene. Legg merke til:
- Ser dere forskjellige formater for samme type data? (f.eks. datoer, beløp)
- Finnes det typos eller inkonsistente verdier?
- Ser dere tomme verdier eller rare tegn?
- Hvordan ville slike data påvirke analyser?
Dette er et lite utvalg - i workshopen skal dere jobbe med 1 million rader med lignende utfordringer!