Review : Segmentation of dynamic objects in video sequences fusing the strengths of a background subtraction model, optical flow and matting algorithms

By Graciela Ramírez-Alonso; Mario I. Chacón-Murguía

Dalam makalah ini kami mengusulkan untuk menggabungkan beberapa algoritme segmentasi video mutakhir dengan cara yang tidak diawasi untuk memanfaatkan kekuatannya. Proposal tersebut didasarkan pada model Background Subtraction (BS) dengan arsitektur jaringan syaraf tiruan Self Organized Map dan update ambang otomatis yang telah terbukti kuat terhadap perubahan iluminasi dan sedikit masalah bayangan. Algoritma Optical Flow akan menganalisis daerah dinamis yang dideteksi oleh model BS dan akan dilampirkan dalam elips yang memiliki kecepatan yang sama dan mungkin menentukan objek dinamis yang sama yang identifikasi tidak lengkap karena masalah kamuflase. Elips ini akan berfungsi sebagai masukan yang dibutuhkan oleh algoritma Matting yang akan memperbaiki definisi objek dinamis dengan meminimalkan fungsi biaya. Hasil segmentasi akhir menunjukkan bahwa perpaduan kedua metode ini menghasilkan recall yang lebih baik dan metrik tingkat negatif yang salah dibandingkan dengan model BS saja. Membandingkan hasil kami dengan model-model state-of-the-art lainnya yang dilaporkan menunjukkan keefektifan proposal kami.

Venue : 2014 Southwest Symposium on Image Analysis and Interpretation

URL : http://ieeexplore.ieee.org/document/6806022/

Kesimpulan

Karena banyak faktor yang mempengaruhi kinerja algoritma segmentasi video dan segmentasi objek dinamis yang sempurna adalah tugas yang sangat menantang, makalah ini menyajikan sebuah pendekatan untuk menggunakan kekuatan model dan algoritma stateof-the-art yang berbeda dan mengusulkan yang baru dimana berbeda. metodologi digunakan bersamaan untuk menghasilkan segmentasi yang akurat tanpa definisi parameter awal untuk setiap video yang akan dianalisis. Setelah meninjau banyak algoritma keadaan seni, kami menemukan bahwa model BS adalah metodologi yang sangat populer yang digunakan untuk mengidentifikasi objek dinamis dalam adegan video. Dalam makalah ini kami memutuskan untuk menggunakan model BS berdasarkan arsitektur SOM dimana parameternya secara otomatis diperbarui (dynamic thresholds) tergantung dari sifat video. Metodologi lain yang ditemukan dalam literatur adalah algoritma Matte. Algoritma ini dapat memisahkan area Band F secara akurat namun sebagian besar jenis algoritme diimplementasikan dengan cara yang diawasi saat trimap pada awalnya ditentukan oleh pengguna. Dalam makalah ini kami mengusulkan sebuah gagasan untuk menghitung OF di daerah dinamis yang didefinisikan oleh model BS dan melampirkan dalam elips daerah yang menyajikan model kecepatan serupa. Elips ini bisa menjadi input trimap yang dibutuhkan algoritma Matte. Dengan penerapan ide ini kita bisa memperbaiki hasil segmentasi dibandingkan jika model BS digunakan sendiri, terutama recall dan metrik FNR. Ketika membandingkan proposal kami dengan beberapa algoritme mutakhir, kami menemukan bahwa mereka tidak melaporkan hasil apapun dengan situasi perubahan iluminasi, mungkin karena lebih umum sebuah video menghadirkan latar belakang dinamis atau masalah kamuflase. Tapi, karena model kami memang memperhatikan perubahan iluminasi dalam beberapa situasi lain di mana latar belakang dinamis yang parah terjadi, kinerja sedikit terpengaruh. Akibatnya, proposal kami ada dalam dua hasil terbaik hanya dalam dua video yang disajikan pada tabel 2 namun kami harus ingat bahwa semua metode lainnya memerlukan definisi parameter awal di mana setiap video harus dianalisis untuk menemukan yang terbaik. nilai parameter Dalam implementasi di masa depan, kita akan mempertimbangkan secara lebih rinci situasi di mana latar belakang dinamis yang parah hadir di lokasi kejadian untuk meningkatkan kinerja kita dalam situasi tersebut dan mencapai hasil yang lebih baik saat membandingkannya dengan penulis lainnya.