dc.description.abstract | Banjir adalah fenomena alam yang sering terjadi di Indonesia, termasuk di Kota Samarinda yang mengalami masalah banjir dalam tiga tahun terakhir dengan dampak ribuan rumah sebanyak 27.000 jiwa terkena banjir. Untuk memprediksi bencana banjir dibutuhkan teknologi machine learning menggunakan metode klasifikasi data mining. Namun, pada proses klasifikasi seringkali terjadi permasalahan yang berkaitan dengan data berdimensi tinggi ini dapat menyebabkan overfitting dan ketidakseimbangan kelas yang menyebabkan bias pada kelas yang dominan dengan mengabaikan kelas minoritas. Penelitian ini bertujuan untuk meningkatkan nilai akurasi klasifiikasi pada data banjir Kota Samarinda menggunakan algoritma K-Nearest Neighbor (KNN) yang dikombinasikan seleksi fitur relief dan optimasi Particle Swarm Optimization (PSO). Metode validasi yang digunakan adalah 10-fold cross-validation, sementara evaluasi kinerja model dilakukan menggunakan confusion matrix. Data yang digunakan diperoleh dari BPBD dan BMKG Kota Samarinda pada rentang tahun 2021-2023, dengan 19 fitur dan total 1095 record. Hasil seleksi fitur Relief didapatkan empat fitur penting, yaitu arah angin maksimum, kecepatan angin, kecepatan angin rata-rata, dan arah angin maksimum. Evaluasi rata-rata dengan nilai k=3, k=5, k=7, k=11, k=13, dan k=15 menunjukkan penerapan seleksi fitur Relief dan optimasi PSO, efektif dalam meningkatkan akurasi pada algoritma k-Nearest Neighbor pada data banjir dengan hasil akurasi KNN dan PSO memberikan peningkatan sebesar 2-5%, KNN dengan seleksi fitur Relief memberikan peningkatan sebesar 1-2% dan KNN dengan kombinasi Relief dan PSO memberikan peningkatan sebesar 2-5%. Kombinasi model KNN, Relief, PSO diharapkan dapat memberikan peforma yang optimal dalam klasifikasi data banjir Kota Samarinda. | id_ID |