2018 : INTEGRASI SYNTHETIC MINORITY OVERSAMPLING TECHNIQUE (SMOTE) DAN TEKNIK DATA MINING UNTUK MENGATASI KETIDAKSEIMBANGAN KELAS

Wahyu Wibowo S.Si, M.Si
Noviyanti Santoso S.Si., M.Si.

External link

Type

RESEARCH

Keywords

-


Abstract

Ketidakseimbangan kelas merupakan permasalahan yang seringkali ditemui di berbagai bidang, meliputi finansial, perbankan, maupun kesehatan. Suatu dataset dengan pendistribusian kelas yang tidak seimbang berarti jumlah kelas mayoritas (negatif) lebih besar dibandingkan kelas minoritas (positif). Di dalam data mining, ketidakseimbangan kelas merupakan masalah sulit yang harus dicari solusinya. Hal ini karena machine learning disusun dengan menggunakan algoritma dengan asumsi jumlah instance pada setiap kelas seimbang, sehingga apabila digunakan pada kelas yang tidak seimbang memungkinkan hasil prediksi tidak sesuai. Beberapa solusi ditawarkan untuk mengatasi ketidakseimbangan kelas, antara lain oversampling, undersampling, dan synthetic minority oversampling technique (SMOTE). Baik oversampling maupun undersampling memiliki kekurangan, sehingga SMOTE menjadi alternatif untuk mengatasi hal tersebut. Dengan mengintegrasikan SMOTE pada metode klasifikasi data mining yaitu Naïve Bayes, support vector machine (SVM), dan random forest (RF) diharapkan hasilnya dapat meningkatkan performa akurasi. Sehingga dapat dijadikan model prediksi yang berguna untuk early warning system terutama pada kasus dengan kelas tidak seimbang.