Analisis Pengaruh Gain Ratio untuk Algoritma K-Nearest Neighbor pada Klasifikasi Data Banjir di Kota Samarinda
Abstract
Berdasarkan data yang diperoleh dari BMKG dan BPBD Kota Samarinda, diketahui bahwa telah terjadi bencana banjir pada periode tahun 2019 - 2020 di Kota Samarinda. Penelitian ini bertujuan untuk melakukan klasifikasi data banjir di Kota Samarinda menggunakan algoritma K-Nearest Neighbor dan pembagian data menerapkan teknik 5-Fold Cross-Validation serta perhitungan rumus jarak Euclidean Distance. Kemudian, dilakukan seleksi fitur pada algoritma KNN menggunakan metode Gain Ratio guna mengetahui pengaruhnya terhadap akurasi dari KNN. Hasil penelitian menunjukkan bahwa peningkatan akurasi tertinggi setelah menerapkan Gain Ratio didapatkan oleh K=7 dengan persentase kenaikan akurasi sebesar 5,95%, diikuti oleh K=5 dengan persentase kenaikan akurasi 5,81%, K=3 dengan persentase kenaikan akurasi 5,68%, K=9 sebesar 3,61%, K=11 sebesar 2,44%, dan K=13 sebesar 1,23%. Hanya ada satu akurasi yang tidak mengalami peningkatan atau penurunan akurasi, yaitu K=15.