Pemanfaatan Algoritma CatBoost dalam Analisis Kualitas Udara di Jakarta Berdasarkan PM2.5 dan NO
Model Klasifikasi untuk Mendukung Sistem Pemantauan Udara Perkotaan
Keywords:
kualitas udara, CatBoost, PM2.5, nitrogen monoksida, JakartaAbstract
Pencemaran udara di wilayah perkotaan menjadi isu serius karena peningkatan aktivitas transportasi dan industrialisasi menyebabkan tingginya konsentrasi polutan, khususnya PM2.5 dan SO₂. Kondisi ini menimbulkan masalah kesehatan dan menuntut adanya sistem pemantauan kualitas udara yang akurat. Penelitian sebelumnya menunjukkan bahwa metode berbasis machine learning, termasuk CatBoost, mampu memberikan performa prediksi yang baik, namun sebagian studi masih bergantung pada banyak variabel atau menghadapi kendala ketidakseimbangan kelas. Penelitian ini menawarkan solusi dengan membangun model klasifikasi kualitas udara menggunakan algoritma CatBoost hanya dengan dua fitur utama, yaitu PM2.5 dan SO₂, sehingga lebih sederhana namun tetap efektif. Data kualitas udara harian tahun 2021–2025 digunakan sebagai dasar pelatihan, dengan pembagian 80% data latih dan 20% data uji serta penerapan class weighting otomatis. Hasil evaluasi menunjukkan bahwa model mampu mengklasifikasikan sebagian besar kategori dengan baik, ditandai akurasi 0,95 dan weighted f1-score 0,95, meskipun kategori SANGAT TIDAK SEHAT tidak terbaca akibat minimnya data. Temuan ini mengindikasikan bahwa CatBoost merupakan pendekatan yang layak dan efisien untuk mendukung sistem pemantauan kualitas udara berbasis data di perkotaan.