2018 : ALGORITMA BOOSTING UNTUK MENANGANI PEMODELANKLASIFIKASI IMBALANCED DATA PADA EVALUASI BEASISWA BIDIK MISI

Prof., Drs. Nur Iriawan MIKom.,Ph.D.
Dr. Dra Kartika Fithriasari M.Si

External link

Type

RESEARCH

Keywords

-


Abstract

ALGORITMA BOOSTING UNTUK MENANGANI PEMODELANKLASIFIKASI IMBALANCED DATA PADA EVALUASI BEASISWA BIDIK MISI RINGKASAN Pemodelan klasifikasi bertujuan untuk menemukan suatu fungsi keputusan yang secara akurat memprediksi kelas dari data testing yang berasal dari fungsi distribusi yang sama dengan data untuk training. Pada beberapa kasus seringkali terjadi imbalanced data. Kondisi ini dapat menyebabkan hasil klasifikasi tidak optimal. Jika kelompok data yang dianggap penting mempunyai persentase kecil maka ada kemungkinan tingkat ketepatan keseluruhan adalah tinggi tetapi untuk untuk kelompok yang dianggap kecil mempunyai tingkat akurasi rendah. Kondisi ini yang menyebabkan evaluasi model klasik pada data imbalanced tidak sesuai.Beasiswa Bidikmisi merupakan bantuan biaya hidup dan biaya pendidikan untuk calon mahasiswa dari keluarga kurang mampu yang berpotensi akademik unggul sebagai jaminan bahwa calon mahasiswa tersebut nantinya dapat menyelesaikan pendidikan di Perguruan Tinggi dengan tepat waktu. Untuk melihat apakah pemberian beasiswa sudah tepat sasaran perlu dilakukan evaluasi. Evalusi dilakukan melalui pemodelan klasifikasi beasiswa bidik misi. Dengan mengetahui faktor-faktor yang signifikan mempengaruhi penerimaan beasiswa maka crosscheck terhadap siswa yang menerima beasiswa dapat dilakukan. Metode data mining yang berkaitan dengan data yang berasal dari lingkungan pendidikandisebut Educational Data Mining (EDM).Pada teknik klasifikasi diberikan kelompok pada setiap keadaan. Setiap keadaan berisi sekelompok atribut, salah satunya adalah class atribut. Pada penelitian ini terdapat 3 (tiga) class yaitu diterima D3 (1.734%), diterima S1 (22.342%) dan tidak diterima (75.924%).Kondisi kelas yang seperti itu disebutkondisi data imbalance.Imbalance data terjadi ketika satu kelas melebihi jumlah kelas lainnya. Kelas data banyak disebut kelas mayoritas atau kelas negatif sedangkan kelas data sedikit disebut kelas minoritas atau kelas positif. Kondisi imbalance data menjadi masalah dalam klasifikasi, karena mesin klasifikasiakan condong memprediksi ke kelas mayoritas dibandingkan kelas minoritas Belakangan ini permasalahan kelas imbalance telah dikenali sebagai masalah yang krusial dalam machine learning dan data mining.Berdasarkan kondisi diatas maka untuk evaluasi pelaksanaan bidik misi harus menggunakan metode machine learningyang mampu mengatasi imbalance data. Salah satu metode yang diusulkan adalah machine learningdengan algoritma boosting. Model yang didapat akan dievaluasi dengan menggunakan kurva Relative Operating Characteristics (ROC).