Repository ini berisi analisis data kualitas udara menggunakan dataset Air Quality yang disediakan pada soal tugas. Analisis difokuskan pada eksplorasi konsentrasi PM2.5 serta hubungannya dengan faktor cuaca dan pola musiman.
dataset Air Quality yang disediakan terdiri dari data kualitas udara dan faktor cuaca dari beberapa stasiun pengamatan. Tahapan analisis dimulai dari penggabungan data, pembersihan data (data cleaning), serta feature engineering untuk menghasilkan data yang siap dianalisis.
Pendekatan yang digunakan meliputi Exploratory Data Analysis (EDA) untuk mengeksplorasi pola dan hubungan dalam data, serta Machine Learning sederhana berupa regresi linear sebagai pendukung analisis.
dataset : https://github.com/marceloreis/HTI/tree/master
- Python
- Pandas
- NumPy
- Matplotlib
- Seaborn
- Streamlit
- Buka file
.ipynbmenggunakan Jupyter Notebook atau Google Colab. - Jalankan cell secara berurutan untuk melihat proses analisis data.
pip install -r requirements.txt
streamlit run dashboard/app.py
exitlink dashboard : https://dashboardairqualityanalysis-ftjr7zzwjt7rqsngdwn8v4.streamlit.app/
- Konsentrasi PM2.5 menunjukkan pola musiman, dengan nilai lebih tinggi pada musim dingin. Kecepatan angin memiliki pengaruh negatif paling kuat terhadap PM2.5.
- Faktor cuaca berkontribusi terhadap variasi kualitas udara.