2014 : ALGORITMA PREDIKSI OUTLIER MENGGUNAKAN BORDER SOLVING SET

Prof. Ir. Arif Djunaidy M.Sc., Ph.D.


Abstract

Prediksi outlier penting untuk menjaga validitas data. Algoritma prediksi outlier konvensional memiliki kelemahan dalam hal efisiensi karena harus membandingkan data yang akan diprediksi dengan seluruh data dalam data set. Konsep baru yang melibatkan solving set muncul sebagai solusi atas permasalahan efisiensi dalam prediksi outlier. Dengan menggunakan solving set, waktu prediksi menjadi lebih cepat tetapi akurasi prediksi menjadi lebih jelek. Dalam penelitian ini dikembangkan suatu algoritma prediksi outlier baru yang efisien dalam melakukan prediksi tetapi tidak mengorbankan akurasi hasil prediksi. Algoritma baru ini merupakan inovasi terhadap konsep solving set yang sudah dikembangkan sebelumnya. Dalam penelitian sebelumnya, solving set didefinisikan sebagai subset dari data set yang beranggotakan data yang menjadi top noutlier sebagai representasi data set. Sedangkan dalam penelitian ini, solving set didefinisikan ulang sebagai subset dari data set yang merupakan data tepi klaster beserta pusat klasternya sebagai representasi data set, atau selanjutnya disebut border solving set. Data tepi klaster dideteksi menggunakan algoritma BORDER yang telah terbukti dapat mendeteksi data tepi klaster secara efisien, dan algoritma klasterisasi berbasis hirarki digunakan untuk melakukan klasterisasi data tepi yang telah terdeteksi. Selanjutnya, pusat masing-masing klaster dicari dengan menghitung nilai median dari data tepi pada masing-masing klaster. Algoritma Prediksi Outlier dalam penelitian ini dilakukan dengan membandingkan jarak antara data yang akan diprediksi (query data) dengan pusat klaster dan jarak …