Perbandingan Algoritma Naive Bayes Dan K-Nearest Neighbor Pada Klasifikasi Email
DOI:
https://doi.org/10.33998/jakakom.2025.5.2.2378Kata Kunci:
Spam Email, Naive Bayes, K-Nearest Neighbor, TF-IDF, Google ColabAbstrak
Penelitian ini membandingkan algoritma Naive Bayes dan K-Nearest Neighbor (KNN) dalam klasifikasi email menggunakan fitur TF-IDF. Dataset terdiri atas 5.572 email yang diproses melalui pelatihan dan evaluasi model dengan validasi silang 5-fold. Metode evaluasi mencakup akurasi, precision, recall, F1-score, dan ROC/AUC. Hasil menunjukkan Naive Bayes unggul dengan akurasi 98,38% dan AUC 0,98 dibandingkan KNN yang mencapai akurasi 92,47% dan AUC 0,82. Naive Bayes lebih stabil dalam recall pada kelas spam (89%), sementara KNN memiliki precision sempurna (100%) namun rendah recall (44%).
Unduhan
Referensi
A. H. Awadallah, S. Dumais, And T. Alrashed, “The Lifetime Of Email Messages: A Large-Scale Analysis Of Email Revisitation,” In Chiir 2018 - Proceedings Of The 2018 Conference On Human Information Interaction And Retrieval, Association For Computing Machinery, Inc, Feb. 2018.
H. Mukhtar, J. Al Amien, And M. A. Rucyat, “Filtering Spam Email Menggunakan Algoritma Naïve Bayes,” Jurnal . (Computer Science And Information Technology), Vol. 3, No. 1, Pp. 9–19, May 2022.
P. Putra, A. M. H Pardede, And S. Syahputra, “Analisis Metode K-Nearest Neighbour (Knn) Dalam Klasifikasi Data Iris Bunga,” Jurnal Teknik Informatika Kaputama (Jtik), Vol. 6, No. 1, 2022.
A. P. Wibawa, M. Guntur, A. Purnama, M. Fathony Akbar, And F. A. Dwiyanto, “Metode-Metode Klasifikasi,” Prosiding Seminar Ilmu Komputer Dan Teknologi Informasi, Vol. 3, No. 1, 2018.
A. Wibisono Informatika, “Filtering Spam Email Menggunakan Metode Naive Bayes,” Teknologipintar.Org, Vol. 3, No. 4, Pp. 2023–2024.
E. Firasari, N. Khasanah, U. Khultsum, D. N. Kholifah, R. Komarudin, And W. Widyastuty, “Comparation Of K-Nearest Neighboor (K-Nn) And Naive Bayes Algorithm For The Classification Of The Poor In Recipients Of Social Assistance,” In Journal Of Physics: Conference Series, Iop Publishing Ltd, Nov. 2020.
M. M. Danyal, S. S. Khan, M. Khan, S. Ullah, M. B. Ghaffar, And W. Khan, “Sentiment Analysis Of Movie Reviews Based On Nb Using Tf–Idf And Count,” Soc Netw Anal Min, Vol. 14, No. 1, Dec. 2024.
S. W. Kim And J. M. Gil, “Research Paper Classification Systems Based On Tf-Idf And Lda Schemes,” Human-Centric Computing And Information Sciences, Vol. 9, No. 1, Dec. 2019
Y. I. Kurniawan, “Perbandingan Algoritma Naive Bayes Dan C.45 Dalam Klasifikasi Data Mining,” Jurnal Teknologi Informasi Dan Ilmu Komputer, Vol. 5, No. 4, Pp. 455–464, Oct. 2018
H. Ma’rifah, A. P. Wibawa, and M. I. Akbar, “Klasifikasi Artikel Ilmiah Dengan Berbagai Skenario Preprocessing,” Sains, Apl. Komputasi dan Teknol.Inf., vol. 2, no. 2, p. 70, 2020, doi:10.30872/jsakti.v2i2.2681..
A. Indriani, “Analisa Perbandingan Metode Naïve Bayes Classifier Dan K-Nearest Neighbor Terhadap Klasifikasi Data,” Sebatik, vol. 24, no. 1, pp. 1–7, 2020, doi: 10.46984/sebatik.v24i1.909.
S. A. Pangestu, C. Aminuallah, S. I. Akuntansi, And S. Informasi, “Klasifikasi Opini Publik Tentang Covid-19 Di Twitter Menggunakan Metode Pengklasifikasi Naive Bayes Dan Knn.”
R. Marsuciati, G. Gumelar, And R. Prietno, “Klasifikasi Metode Naïve Bayes Dan K-Nearest Neighbor Untuk Menentukan Keluarga Tidak Mampu. 2020
A. A. Hania, “Artificial Intelligence, Machine Learning, Neural Network, Dan Deep Learning,” 2017
M. K. Anam And D. A. Jakaria, “Sistem Prediksi Harga Kripto Dengan Metode Regresi,” Vol. 10, No. 2, Pp. 467–479, 2023
T. Wahyono, U. Kristen, And S. Wacana, “Fundamental Of Python For Machine Learning: Dasar-Dasar Pemrograman Python Untuk Machine Learning Dan Kecerdasan Buatan,” 2018
D. Aplikasinya Tim Penulis Et Al., Data Mining. 2021