Analisis performa metode klasifikasi Naïve Bayes Classifier pada Unbalanced Dataset

  • Ericha Apriliyani Program Studi Teknik Informatika Universitas Muslim Indonesia
  • Yulita Salim Universitas Muslim Indonesia
Keywords: Naïve Bayes Classifier, Unbalanced Dataset, Accuracy, Precision, F-measure

Abstract

Penelitian ini bertujuan menganalisis menganalisis performa metode Naïve Bayes Classifier pada berbagai variasi unbalanced dataset. Teknik klasifikasi yang digunakan yaitu dengan menggunakan pengukuran performa accuracy, precision, recall, dan f-measure dengan menggunakan metode Naïve Bayes Classifier. Dataset diambil dari Kaggle, dan dari tiap dataset memiliki data yang tidak seimbang atau unbalance, data inilah yang akan dihitung performanya menggunakan metode Naïve Bayes Classifier. Berdasarkan hasil pengujian menggunakan metode Naïve Bayes Classifier didapatkan pada dataset Glass yaitu accuracy sebesar 46%, precision sebesar 47%, recall sebesar 46% dan f-measure sebesar 43%, pada dataset Heart Disease yaitu accuracy sebesar 88%, precision sebesar 88%, recall sebesar 88% dan f-measure sebesar 88%, pada dataset Kidney Disease yaitu accuracy sebesar 100%, precision sebesar 100%, recall sebesar 100% dan f-measure sebesar 100%, pada dataset Liver Disease yaitu accuracy sebesar 78%, precision sebesar 82%, recall sebesar 78% dan f-measure sebesar 79%, pada dataset Diabetes yaitu accuracy sebesar 77%, precision sebesar 76%, recall sebesar 77% dan f-measure sebesar 76%, dan pada dataset Breast Cancer yaitu accuracy sebesar 94%, precision sebesar 94%, recall sebesar 94% dan f-measure sebesar 94%. Hasil penelitian ini menunjukkan metode Naive Bayes Classifier pada unbalanced dataset memperoleh nilai performa yang tidak menentu.

Downloads

Download data is not yet available.

References

A. Saifudin, U. Pamulang, R. S. Wahono, U. Dian, and N. Semarang, “Pendekatan Level Data untuk Menangani Ketidakseimbangan Kelas pada Prediksi Cacat Software,” J. Softw. Eng., vol. 1, no. 2, pp. 76–85, 2015.

I. Fauzan, “Artificial Intelligence (AI) Pada Proses Pengawasan dan Pengendalian Kepegawaian - Sebuah Eksplorasi Konsep Setelah Masa Pandemi Berakhir,” J. Civ. Serv., vol. 14, no. 1, pp. 31–42, 2020.

F. Tangguh and Y. Islami, “Analisis performa algoritma Stochastic Gradient Descent ( SGD ) dalam mengklasifikasi tahu berformalin,” Indones. J. Data Sci., vol. 3, no. 1, pp. 1–8, 2022.

L. B. C. Tanujayaa, B. Susanto, and A. Saragiha, “Perbandingan Metode Regresi Logistik dan Random Forest untuk Klasifikasi Fitur Mode Audio Spotify,” Indones. J. data Sci., vol. 1, no. 3, pp. 68–78, 2020.

Wahyu ngestisari, “The Perbandingan Metode ARIMA dan Jaringan Syaraf Tiruan untuk Peramalan Harga Beras,” Indones. J. Data Sci., vol. 1, no. 3, pp. 96–107, 2020, doi: 10.33096/ijodas.v1i3.18.

A. A. D. Halim and S. Anraeni, “Analisis Klasifikasi Dataset Citra Penyakit Pneumonia menggunakan Metode K-Nearest Neighbor (KNN),” Indones. J. Data Sci., vol. 2, no. 1, pp. 01–12, 2021, doi: 10.33096/ijodas.v2i1.23.

F. T. Admojo and Ahsanawati, “Klasifikasi Aroma Alkohol Menggunakan Metode KNN,” Indones. J. Data Sci., vol. 1, no. 2, pp. 34–38, 2020.

D. Cahyanti, A. Rahmayani, and S. Ainy, “Analisis performa metode Knn pada Dataset pasien pengidap Kanker Payudara,” Indones. J. Data Sci., vol. 1, no. 2, pp. 39–43, 2020.

Harlinda and Nasir, “Perancangan sistem pendukung keputusan dalam pengalokasian dana bantuan sosial di kabupaten pinrang dengan menggunakan metode AHP,” Indones. J. Data Sci., vol. 1, no. 2, pp. 44–51, 2020.

S. Sahar, “Analisis Perbandingan Metode K-Nearest Neighbor dan Naïve Bayes Clasiffier Pada Dataset Penyakit Jantung,” Indones. J. Data Sci., vol. 1, no. 3, pp. 79–86, 2020, doi: 10.33096/ijodas.v1i3.20.

H. Azis, “Klasifikasi Penyakit Jantung Menggunakan Metode K-Nearest Neighbor,” Indones. J. Data Sci., pp. 1–4, 2018, doi: https://doi.org/10.33096/ijodas.v1i1.3.

M. D. U. Ulhaq and Irawati, “Implementasi Metode Visekriterijumsko Kompromisno Rangiranje (VIKOR) Pada Seleksi Program Keluarga Harapan Komponen Pendidikan Berbasis Web,” Indones. J. Data Sci., vol. 2, no. 1, pp. 38–49, 2021, doi: 10.33096/ijodas.v2i1.30.

A. Maulida, “Penerapan Metode Klasifikasi K-Nearest Neigbor pada Dataset Penderita Penyakit Diabetes,” Indones. J. Data Sci., vol. 1, no. 2, pp. 29–33, 2020.

Hasran, “Klasifikasi Penyakit Jantung Menggunakan Metode K-Nearest Neighbor,” Indones. J. Data Sci., vol. 1, no. 1, pp. 1–4, 2020.

I. P. Putri, “Analisis Performa Metode K- Nearest Neighbor (KNN) dan Crossvalidation pada Data Penyakit Cardiovascular,” Indones. J. Data Sci., vol. 2, no. 1, pp. 21–28, 2021, doi: 10.33096/ijodas.v2i1.25.

D. Susanti, “Analisis Modifikasi Metode Playfiar Cipher Dalam Pengamanan Data,” Indones. J. Data Sci., vol. 1, no. 1, pp. 1–80, 2020.

A. Prasetya Wibawa, W. Lestar, A. Bella Putra Utama, I. Tri Saputra, and Z. Nabila Izdihar, “Multilayer Perceptron untuk Prediksi Sessions pada Sebuah Website Journal Elektronik,” Indones. J. Data Sci., vol. 1, no. 3, pp. 57–67, 2020, doi: 10.33096/ijodas.v1i3.15.

Dwi Retnosari, “Sistem Aplikasi Data Mining Untuk Menampilkan,” J. Integr. Sist. Ind. UMJ, vol. 1, no. 2, pp. 13–20, 2014.

F. Mulianingsih, K. Anwar, F. A. Shintasiwi, and A. J. Rahma, “Program Studi Tadris Ilmu Pengetahuan Sosial Institut Agama Islam Negeri Kudus Artificial Intellegence dengan Pembentukan Nilai dan Karakter di Bidang Pendidikan,” Ijtimaiya J. Soc. Sci. Teach., vol. 4, no. 2, pp. 148–154, 2020.

A. Roihan, P. A. Sunarya, and A. S. Rafika, “Pemanfaatan Machine Learning dalam Berbagai Bidang: Review paper,” IJCIT (Indonesian J. Comput. Inf. Technol., vol. 5, no. 1, pp. 75–82, 2020, doi: 10.31294/ijcit.v5i1.7951.

R. D. Fitriani, H. Yasin, and T. Tarno, “PENANGANAN KLASIFIKASI KELAS DATA TIDAK SEIMBANG DENGAN RANDOM OVERSAMPLING PADA NAIVE BAYES (Studi Kasus: Status Peserta KB IUD di Kabupaten Kendal),” J. Gaussian, vol. 10, no. 1, pp. 11–20, 2021, doi: 10.14710/j.gauss.v10i1.30243.

H. Azis, F. T. Admojo, and E. Susanti, “Analisis Perbandingan Performa Metode Klasifikasi pada Dataset Multiclass Citra Busur Panah,” Techno.Com, vol. 19, no. 3, 2020.

A. Fitria and H. Azis, “Analisis Kinerja Sistem Klasifikasi Skripsi menggunakan Metode Naïve Bayes Classifier,” Pros. Semin. Nas. Ilmu Komput. dan Teknol. Inf., vol. 3, no. 2, pp. 102–106, 2018.

M. M. Baharuddin, T. Hasanuddin, and H. Azis, “Analisis Performa Metode K-Nearest Neighbor untuk Identifikasi Jenis Kaca,” Ilk. J. Ilm., vol. 11, no. 28, pp. 269–274, 2019.

A. A. Karim, H. Azis, and Y. Salim, “Kinerja Metode C4.5 dalam Penyaluran Bantuan Dana Bencana 1,” Pros. Semin. Nas. Ilmu Komput. dan Teknol. Inf., vol. 3, no. 2, pp. 84–87, 2018.

L. Nurhayati and H. Azis, “Perancangan Sistem Pendukung Keputusan Untuk Proses Kenaikan Jabatan Struktural Pada Biro Kepegawaian,” Semin. Nas. Teknol. Inf. dan Multimed., pp. 6–7, 2016.

F. Muharram, H. Azis, and A. R. Manga, “Analisis Algoritma pada Proses Enkripsi dan Dekripsi File Menggunakan Advanced Encryption Standard (AES),” Pros. Semin. Nas. Ilmu Komput. dan Teknol. Inf., vol. 3, no. 2, pp. 112–115, 2018.

Y. I. Kurniawan, “Perbandingan Algoritma Naive Bayes dan C.45 dalam Klasifikasi Data Mining,” J. Teknol. Inf. dan Ilmu Komput., vol. 5, no. 4, p. 455, 2018, doi: 10.25126/jtiik.201854803.

A. Saleh, “Implementasi Metodel Klasifikasi Naive Bayes,” Citec J., vol. 2, no. 3, pp. 207–217, 2015, doi: 10.20895/inista.v1i2.73.

F. Liantoni and H. Nugroho, “Klasifikasi Daun Herbal Menggunakan Metode Naïve Bayes Classifier Dan Knearest Neighbor,” J. Simantec, vol. 5, no. 1, pp. 9–16, 2015.

Herman et al., “Comparison of Artificial Neural Network and Gaussian Naïve Bayes in Recognition of Hand-Writing Number,” in 2018 2nd East Indonesia Conference on Computer and Information Technology (EIConCIT), 2018, pp. 276–279, doi: 10.1109/EIConCIT.2018.8878651.

R. N. Devita, H. W. Herwanto, and A. P. Wibawa, “Perbandingan Kinerja Metode Naive Bayes dan K-Nearest Neighbor untuk Klasifikasi Artikel Berbahasa indonesia,” J. Teknol. Inf. dan Ilmu Komput., vol. 5, no. 4, p. 427, 2018, doi: 10.25126/jtiik.201854773.

C. A. Sugianto, “Penerapan Teknik Data Mining Untuk Menentukan Hasil Seleksi Masuk SMAN 1 Gibeber Untuk Siswa Baru Menggunakan Decision Tree,” J. TEDC, vol. 9, no. 1, pp. 39–43, 2015, doi: 10.31227/osf.io/vedu7.

C. Anam and N. Rusdiana, “Analisis Pemeringkatan Kualitas Klasifier Pada Dataset Tidak Seimbang,” J I M P - J. Inform. Merdeka Pasuruan, vol. 5, no. 1, pp. 38–44, 2020, doi: 10.37438/jimp.v5i1.248.

Maryamah, M. F. Asikin, D. Kurniawaty, S. K. Sari, and I. Cholissodin, “Implementasi Metode Naïve Bayes Classifier untuk Seleksi Asisten Praktikum pada Simulasi Hadoop Multinode Cluster,” J. Teknol. Inf. dan Ilmu Komput., vol. 3, no. 4, pp. 273–278, 2016.

R. Siringoringo, “KLASIFIKASI DATA TIDAK SEIMBANG MENGGUNAKAN ALGORITMA SMOTE DAN k-NEAREST NEIGHBOR,” Isd , vol. 3, no. 1, pp. 2528–5114, 2018.

Published
2022-07-31