Perbandingan Metode K – Nearest Neighbor (KNN) dan Naive Bayes terhadap Analisis Sentimen pada Pengguna E-Wallet Aplikasi Dana Menggunakan Fitur Ekstraksi TF-IDF
Abstract
Penelitian ini membandingkan akurasi metode K-Nearest Neighbor (KNN) dan Naive Bayes dalam klasifikasi sentimen pengguna aplikasi E-Wallet DANA menggunakan fitur ekstraksi Term Frequency-Inverse Document Frequency (TF-IDF). Data ulasan pengguna dikumpulkan melalui teknik web scraping dan dilabeli oleh ahli bahasa dan model lexicon. Setelah melalui proses pre-processing seperti case folding, cleaning, tokenizing, stopword removal, dan stemming, data diklasifikasikan menggunakan metode KNN dan Naive Bayes. Hasil penelitian menunjukkan bahwa pelabelan data oleh ahli bahasa signifikan dalam meningkatkan akurasi kedua metode klasifikasi tersebut. Selain itu, penggunaan TF-IDF sebagai metode pembobotan kata terbukti efektif dalam meningkatkan performa model klasifikasi sentimen. Analisis sentimen terhadap ulasan pengguna aplikasi DANA mengungkapkan berbagai keluhan dan masalah yang dihadapi oleh pengguna, memberikan informasi yang dapat digunakan untuk memperbaiki fitur dan layanan yang diberikan sehingga dapat meningkatkan kepuasan pengguna. Penelitian ini juga memberikan perbandingan antara metode KNN dan Naive Bayes yang dapat menjadi referensi bagi peneliti lain dalam memilih metode yang sesuai untuk analisis sentimen pada dataset serupa.