2021 : Prediksi Klasifikasi Imbalanced Data Mining Status Ketertinggalan Desa di Jawa Timur dengan Kombinasi Metode Sampling pada Metode Regresi Logistik, Regresi Logistik Ridge dan Analisis Diskriminan Kernel sebagai Dasar Kebijakan Kemajuan Desa Tertinggal

Santi Puteri Rahayu S.Si., M.Si., Ph.D

Year

2021

Published in

-

External link

Type

RESEARCH

Keywords

-


Abstract

Permasalahan kesenjangan pembangunan antar daerah di Indonesia masih perlu diperhatikan, yaitu masih belum minimumnya desa tertinggal di beberapa provinsi di Indonesia, dimana salah satunya berada di Jawa Timur. Penelitian ini bertujuan mengklasifikasikan desa tertinggal di Jawa Timur berdasarkan 5 kabupaten yang memiliki persentase desa tertinggal tertinggi, sehingga klasifikasi desa tertinggal dapat dilakukan dengan tepat. Banyak desa pada 5 kabupaten tersebut termasuk kategori Data Mining atau large scale data. Salah satu masalah utama dalam klasifikasi data tersebut adalah komposisi data yang tidak seimbang antar kelas (imbalanced data) yang mengakibatkan akurasi total dan akurasi kelas minor prediksi klasifikasi relatif rendah. Permasalahan ketidakseimbangan tersebut diharapkan dapat diatasi dengan melakukan sampling data sehingga komposisi data antar kelas menjadi seimbang sebelum diklasifikasikan. Metode sampling yang akan digunakan yaitu SMOTE (SM), Tomek Links (TOM), Random Under Sampling (RUS), SM-TOM dan TOM-RUS. Metode klasifikasi Regresi Logistik, Regresi Logistik Ridge dan Analisis Diskriminan Kernel merupakan 3 metode klasifikasi yang akan diterapkan setelah diperoleh data seimbang. Efektivitas kombinasi metode sampling pada akurasi ketiga metode klasifikasi Data Mining tersebut akan dievaluasi untuk mendapatkan metode klasifikasi yang terbaik dalam memprediksi status ketertinggalan desa di Jawa Timur. Sehingga diharapkan metode terbaik tersebut dapat direkomendasikan sebagai tambahan alternatif dasar strategi kebijakan pemerintah terhadap desa yang berstatus tertinggal, termasuk dimungkinkan juga jika terjadi pemekaran di beberapa desa, sehingga klasifikasi desa tertinggal masih perlu selalu dilakukan secara periodik