feat: Inputng and anomally handlinging by DamianRyczko · Pull Request #5 · Solvro/ml-parking-forecasting

DamianRyczko · 2026-01-13T15:29:52Z

No description provided.

GregW04 · 2026-01-15T18:24:28Z

Code Review:

Po pierwsze jestem naprawdę pod dużym wrażeniem pracy włożonej w analizę oraz tworzeniu klas do preprocessingu tych danych. Duże propsy, właśnie takiego czegoś oczekiwałem od ML Enginerrow w tym projekcie.
Sam kod:

Funkcjonalności naprawdę solid +
Zmieniłbym stałą 60 która jest używana w liczeniu limitów, na zmienną np limit_minutes_baseline bo jak wybierzemy freq_miutes na więcej niż 60 np.120 to wtedy nam się kruszą limity
W SksUsersImputer gdy robisz cols_to_fix = X.select_dtypes(include=[np.number]).columns.tolist() wybierasz wszystkie numeryczne wiec jeżeli nowa kolumna is_open jest numeryczna to tez wpadnie tam (tego byśmy nie chcieli)
Dodałbym opcje zmienna interpolating_method dla przyszłych ew. zmian : if interpolating_method := 'linear': X['spaces_left'] = X['spaces_left'].interpolate(method='linear', limit=limit_small)
A propos Interpolacji just to KEEP IN MIND, że jeżeli używamy interpolacji to łatwo o przeciek. Np. Robimy interpolacje na cale dane a potem je dzielimy na train-test to wtedy wartości zinterpolowane w train będa miały w sobie info z przyszłości. Wiec jak aplikujemy jakiekolwiek interpolacje i bill() i ffill() to na już podzielonych danych.
Jeżeli wykryłeś kolejna anomalie np. (błędna pojemność parkingu) w trakcie notebooku to nie zapomnij zrobić do tego funkcje i potem dodać do końcowego kodu.

Co teraz? Ogarniasz te małe uwagi i oczekiwałbym PR do dev z ładnym kodem podzielonym na klasy/ w oddzielnym pliku .py wywolywane w głównym pliku do tego. Dodaj proszę komentarze gdzie się da oraz Google-Styled Docstrings (ChatGPT lub inny LLM to idealny pomysł do tego). Wytestuj jakie dostajesz outputowe tabelki dla przykładowo podzielonych danych train-val-test.

GregW04 · 2026-01-15T18:24:52Z

@DamianRyczko code review rdy

GregW04 · 2026-02-13T10:17:04Z

@DamianRyczko please provide status we need ready Preprocessing steps before moving forward. Given current PWr parking change of regulations you do not need that attention to detail.

feat: Inputng and anomally handlinging

1e335c0

DamianRyczko requested review from DominikaStefaniak and GregW04 January 13, 2026 15:29

pull-request-size bot added the size/XXL label Jan 13, 2026

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Comments

feat: Inputng and anomally handlinging#5

feat: Inputng and anomally handlinging#5
DamianRyczko wants to merge 1 commit intomainfrom
experiment/damian-data-imputing-anomalies

DamianRyczko commented Jan 13, 2026

Uh oh!

GregW04 commented Jan 15, 2026

Uh oh!

GregW04 commented Jan 15, 2026

Uh oh!

GregW04 commented Feb 13, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Comments

Conversation

DamianRyczko commented Jan 13, 2026

Uh oh!

GregW04 commented Jan 15, 2026

Uh oh!

GregW04 commented Jan 15, 2026

Uh oh!

GregW04 commented Feb 13, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants