2017 : Deep Learning untuk Temu Kembali Data Citra Berjumlah Besar

Dr.Eng. Nanik Suciati S.Kom., M.Kom.
Dr.Eng. Chastine Fatichah S.Kom, M.Kom
Wijayanti Nurul Khotimah S.Kom., M.Sc.


Abstract

Pengembangan kota dengan konsep “smart city” berupaya untuk mengintegrasikan solusi berbasis teknologi informasi dan komunikasi (ICT) untuk mengelola berbagai aset dan permasalahan kota seperti sekolah, perpustakaan, sistem transportasi, rumah sakit, listrik, air, sampah, hukum serta pelayanan publik yang lain, secara lebih efektif dan efisien. Solusi tersebut melibatkan berbagai tipe data, yaitu numerik, teks, sinyal, citra (image), dan video. Di antara berbagai tipe data tersebut, data citra telah digunakan pada berbagai bidang, seperti pendidikan, medis, jurnalisme, periklanan, dan hiburan, serta jumlahnya semakin hari meningkat dengan pesat.\nUntuk mengelola data citra dalam jumlah besar, selain dibutuhkan perangkat hardware sebagai media penyimpan, juga diperlukan perangkat lunak (software) yang handal untuk menyimpan dan menemukan kembali data citra (image retrieval). Pada beberapa tahun terakhir, penelitian tentang temu kembali citra berbasis isi – content-based image retrieval (CBIR) telah banyak dilakukan. CBIR bertujuan untuk menemukan citra dengan menganalisa konten visual, sehingga representasi citra merupakan inti dari CBIR. Tantangan utama dalam menyusun representasi citra yang baik adalah menemukan fitur-fitur yang dapat mewakili karakteristik unik dari citra, sehingga fitur tersebut dapat digunakan untuk mengidentifikasi citra secara akurat. Untuk merepresentasikan citra, berbagai deskriptor fitur low level telah diteliti, mulai dari fitur global seperti warna, tepi, tekstur, GIST dan CENTRIST, sampai dengan deskriptor fitur lokal seperti SIFT dan SURF. Pada sistem CBIR tersebut, fitur yang telah diekstrak dari data citra (umumnya disebut “pre-defined feature” atau “crafted feature”), selanjutnya diukur kemiripannya dengan citra dalam database menggunakan fungsi perhitungan jarak. Hasil eksplorasi CBIR pada dataset citra dengan domain spesifik (misal dataset kain batik, dataset citra wajah, dataset daun) dan dengan jumlah citra yang tidak “sangat besar” (kurang dari 1000), menunjukkan performance yang cukup baik (di atas 80%). Namun penggunaan “pre-defined feature” untuk domain citra yang lebih umum (berbagai jenis citra) dan dengan jumlah yang besar, memberikan performance yang tidak terlalu bagus. Hal ini disebabkan karena problem utama pada CBIR, yaitu “semantic gap”, masih belum terpecahkan dengan baik. “Semantic gap” adalah perbedaan pemahaman antara piksel-piksel citra low level yang di-capture oleh mesin dengan konsep semantik high-level yang dipahami oleh manusia. Terinspirasi dengan kesuksesan deep learning pada berbagai aplikasi visi komputer, seperti pengenalan suara dan klasifikasi citra, maka pada penelitian ini akan dilakukan eksplorasi teknik deep learning pada CBIR, terutama untuk mengatasi keterbatasan teknik retrieval menggunakan “pre-defined feature” pada database citra berukuran besar. Teknik deep learning diharapkan dapat menghasilkan performance yang lebih baik pada proses temu kembali citra pada database citra berukuran besar.\n