2019 : Sistem Rekognisi Visual Multilevel dan Bertingkat Menggunakan Bayesian Learning Framework dan Aplikasinya dalam Sistem Cerdas dan Autonomous Vehicles

Ir. Hendra Kusuma M.Eng.Sc.
Dr.Ir. Djoko Purwanto M.Eng.
Dr. Muhammad Rivai ST.,MT.
Ede Mehta Wardhana S.T., M.T
Muhammad Attamimi B.Eng.,M.Eng.,Ph.D
BANU PRASETYO S.FIL.,M.FIL
Muhammad Luthfi Shahab S.Si.,M.Si


Abstract

Sistem rekognisi visual multilevel dan bertingkat adalah sistem yang mampu untuk mengenali suatu benda dalam beberapa level pengenalan melalui informasi visual dan hubungan hierarkis yang ada dalam benda tersebut. Sistem ini sangat penting bagi perkembangan sistem cerdas termasuk didalamnya autonomous vehicles (AV) yang menjadi salah satu fokus penelitian dalam proyek pengembangan smart city, dimana salah satu tuntutannya AV harus mampu mengenali lingkungan (rekognisi lingkungan) yang kompleks dan dinamis. Salah satu faktor penting dalam rekognisi lingkungan adalah informasi visual. Penelitian telah dilakukan dalam rekognisi yang memanfaatkan informasi visual atau disebut juga rekognisi visual, yang meliputi studi tentang fitur rekognisi dan metodologinya. Umumnya skenario yang ada pada rekognisi visual suatu benda dapat diklasifikasikan menjadi beberapa level rekognisi; seperti rekognisi suatu instan, kategori, ataupun bahan; yang dilakukan secara spesifik pada tiap-tiap level tersebut. Pada proposal penelitian ini, kami mengembangkan sistem rekognisi visual multilevel dan bertingkat secara simultan dengan memanfaatkan informasi kontekstual. Konteks di sini adalah hubungan-hubungan yang ada pada tiap-tiap level yang membentuk suatu struktur yang hierarkis. Misalnya suatu “bola sepakbola yang terbuat dari kulit� memiliki label-label seperti bola sepakbola (instan), bola (kategori), kulit (bahan). Hubungan yang berupa konteks semacam ini sangat informatif dalam rekognisi visual multilevel. Bayesian Learning Framework digunakan untuk merumuskan masalah rekognisi tersebut; di mana konteks diekspresikan sebagai prior distribution dan hasil rekognisi di tiap level sebagai likelihood, dan rekognisi multilevel adalah posterior distribution yang harus dihitung. Aplikasi dari penelitian ini meliputi: 1) pemanfaatan untuk deskripsi otomatis dari suatu gambar pada sistem cerdas; 2) komponen utama dan sangat penting dalam pengembangan AV dan service robot, khususnya untuk pengenalan lingkungan yang kompleks dan dinamis, dan manusia menjadi salah satu target pelayanan.