2019 : Pengembangan Algoritma Genetika untuk Text Clustering pada Warehouse Hazard Report Perusahaan Transportasi Logistik

Dr. Irhamah S.Si., M.Si.
Adatul Mukarromah S.Si.,M.Si

External link

Type

RESEARCH

Keywords

-


Abstract

Kecelakaan dapat terjadi kapan saja dan dimana saja baik disengaja maupun tidak disengaja khususnya pada sektor industri. Sebagai tindakan pencegahan, diperlukan sebuah analisis guna mengetahui pola-pola yang terbentuk berdasarkan informasi pada data incident yang dilaporkan. Tujuannya agar perusahaan mampu mengidentifikasi dan melakukan tindakan penanganan secara cepat apabila terjadi hal yang serupa. Salah satu perusahaan multinasional dalam bidang logistik global yang memiliki kesadaran akan hal tersebut adalah PT. X. Jasa yang ditawarkan yakni berupa penyedia layanan warehouse yang tersebar di seluruh Indonesia. Salah satu divisi perusahaan yaitu Divisi Health and Safety Environment (HSE) bertugas untuk melaporkan kejadian incident pada masing-masing warehouse sesuai dengan tingkat penanganannya. Umumnya laporan yang diberikan berupa data text yang ukurannya relatif besar sehingga jika dilakukan secara manual akan memakan waktu yang lama. Oleh karena itu, dalam penelitian ini akan dilakukan pendekatan Text Mining yaitu Text Clustering dalam proses penggalian informasi mengenai incident yang sering terjadi. Text clustering akan dikembangkan untuk menentukan jenis laporan berdasarkan topik-topik yang sesuai pada data Hazard Report. Metode clustering yang digunakan adalah Hierarchical Clustering dan K-Means. Metode Single Linkage Clustering digunakan karena mampu memberikan hasil klaster dengan jumlah paling optimal jika dibandingkan dengan metode hirarki lainnya, sedangkan K-Means merupakan metode partitioned clustering yang dapat memberikan hasil relative baik jika digunakan dalam mengklasterkan data berupa teks. Kedua metode tersebut akan dievaluasi dengan nilai Silhouette untuk mendapatkan jumlah klaster optimal. Salah satu tahapan penting dalam Text Clustering adalah seleksi fitur. Seleksi fitur akan menghilangkan fitur yang tidak relevan dan dapat meningkatkan kualitas dan akurasi clustering serta dapat mempercepat proses learning. Dalam penelitian ini juga akan dikembangkan Algoritma Genetika (GA) untuk seleksi fitur dan dibandingkan dengan metode seleksi fitur yang lain, mengingat keunggulan GA dalam mencari solusi yang global optimum dan menunjukkan performa yang tinggi dalam seleksi fitur di data mining. Hasil akhir klaster akan divisualisasikan dengan metode word cloud.