Analisis Seleksi Fitur berbasis Correlation Pearson pada Algoritma K-Nearest Neighbor dalam Klasifikasi Nilai Mahasiswa Studi Kasus: Universitas Muhammadiyah Kalimantan Timur
Abstract
Berdasarkan data dari Mata Kuliah Dasar Umum (MKDU) di Universitas Muhammadiyah Kalimantan Timur (UMKT) menunjukkan bahwa terjadi penurunan kualitas nilai mahasiswa di UMKT pada tahun 2020-2021. Salah satu mata kuliah yang mengalami penurunan adalah Bahasa Arab. Penelitian ini bertujuan untuk mengklasifikasi data nilai Bahasa Arab di UMKT melalui teknik Data Mining menggunakan algoritma K-Nearest Neighbor (K-NN) dengan rumus jarak Euclidean Distance serta pembagian data 5-Fold Cross-validation. Kemudian, dilakukan seleksi fitur berbasis Correlation Pearson untuk melihat atribut data yang paling berpengaruh sekaligus melihat apakah ada perubahan akurasi pada algoritma K-NN. Hasil penelitian menunjukkan bahwa atribut yang paling berpengaruh adalah Time_spent_on_course, Progress dan Course_completed. Didapatkan K=5 memiliki akurasi rata-rata dari semua fold dengan nilai 66%, dan setelah melakukan seleksi fitur hanya naik sebesar 1%.