Repositori ini berisi rangkaian materi dan homework selama mengikuti Bootcamp di Rakamin Academy. Setiap minggu dilengkapi modul pembelajaran (PDF) dan tugas untuk memperkuat pemahaman konsep.
- Decision untuk drop fitur berdasarkan metode statistik.
- Normalization, Standarization, Label encoding.
- Menentukan tipe analisis berdasarkan jenis tipe data yang ada pada sebuah fitur
- Mengignore Kutukan dimensi jika menggunakan one hot encoding walaupun jadi banyak fitur, robustness No 1 (Credit : Mas Rezki Trianto)
- Implementasi Zscore untuk tipe distribusi normal.
- Menggunakan IQR untuk menbuat fitur kategorik baru.
- SelectKBest untuk memudahkan mencari korelasi antar fitur namun perlu tuning sesuaikan dengan tipe data yang ada. Bisa gunakan metode trial and error untuk mendapatkan jumlah fitur terbaik coba coba antar anova, chi2, dll cek dokumentasi scikit-learn.
/Rakamin-MachineLearningPrep
│
├── .gitignore
├── HandsOn
│ └── Hands-On_EDA.ipynb
├── HandsOn_2
│ └── Hands-on_dataPreprocessing.ipynb
├── Homework
│ └── IGustiNgurahAgungHariVijayaKusuma_Batch_57.ipynb
│ └── Product_Exclusive_Classification.csv
├── IGustiNgurahAgungHariVijayaKusuma_Batch_57.ipynb # Homework dalam notebook
├── IGustiNgurahAgungHariVijayaKusuma_Batch_57.html # Homework dalam HTML
├── Modul1-3.pdf
└── README.md
Materi dan tugas dalam repositori ini adalah milik resmi Rakamin Academy. Semua konten digunakan hanya untuk tujuan referensi dan pembelajaran pribadi, bukan untuk klaim kepemilikan.
Mantap