2017 : KAJIAN ALGORITMA SHARED NEAREST NEIGHBOUR PADA PENGKLASTERAN DOKUMEN PENGABDIAN MASYARAKAT ITS

Drs. Daryono Budi Utomo
Alvida Mustika Rukmi S.Si, M.Si

External link

Type

RESEARCH

Keywords

-


Abstract

Pengabdian kepada Masyarakat adalah salah satu Tri Darma Perguruan Tinggi bagi para dosen di Indonesia. Pengabdian kepada Masyarakat juga melibatkan sivitas akademika, baik dosen maupun mahasiswa, dan diwujudkan dalam publikasi ilmiah dari hasil karya pengabdian kepada masyarakat. Pengklasteran dokumen hasil kegiatan pengabdian masyarakat ITS merupakan upaya dalam memberikan informasi tentang kegiatan pengabdian masyarakat yang telah dilakukan di lingkungan ITS. Informasi yang disajikan, diharapkan mampu memunculkan ide dan kreativitas mendorong minat sivitas akademika untuk berkarya berupa Pengabdian masyarakat. Data dokumen karya Pengabdian masyarakat diolah dengan text mining yang menggunakan Rapid Automatic Keyphrase Extraction (RAKE) sebagai ekstraksi kata kunci dan Latent Semantic Analysis (LSA) untuk menjadikan dokumen sebagai vektor. Selanjutnya, dilakukan proses pengklasteran agar dokumen-dokumen dengan kemiripan topik akan berada dalam klaster yang sama. Penelitian ini akan melakukan kajian pada Algoritma Shared Nearest Neighbour (SNN) dalam pengklasteran dokumen. Karakteristik algoritma SNN didasarkan pada sifat ’ketetanggaan’. Untuk mendapatkan klaster-klaster yang memuat obyek-obyek data dengan kemiripan tinggi diperlukan pengujian dalam menentukan nilai parameter berupa jumlah SNN, jumlah klaster dan nilai epsilon. Dokumen-dokumen akan berada dalam sebuah klaster jika mempunyai jumlah SNN kemiripan topik melebihi ambang batas yang ditentukan. Pada Algoritma SNN, representasi graf berdasarkan Similarity Graph yang terbentuk, menyuguhkan informasi berupa relasi topik pengabdian masyarakat. Relasi antar topik diperlukan agar mengetahui topik-topik yang saling berkaitan dalam menyelesaikan permasalahan pada pengabdian masyarakat. Berdasarkan hasil pengklasteran dengan algoritma SNN, akan mengetahui performa dan validitas klaster-klaster yang terbentuk