Derleme

Derin öğrenme ile 3B nokta bulutlarının sınıflandırılmasına genel bir bakış

Cilt: 13 Sayı: 1 30 Mart 2022
PDF İndir

Derin öğrenme ile 3B nokta bulutlarının sınıflandırılmasına genel bir bakış

Öz

Nokta bulutu (NB) bir vektör uzayında nesneye ait bilgilerin x,y,z koordinat sisteminde matematiksel olarak temsil edilen noktalar kümesidir. Noktalar kaydedilen uzaysal koordinat sisteminde sınıflandırılarak nesne ya da bir alanı ifade eden anlamsal bilgileri tanımlarlar. 3 boyutlu (3B) nokta bulutu gelişen teknolojilerle beraber nesneleri sınıflandırma, algılama ve tanıma alanlarında son zamanlarda oldukça popüler bir hale gelmiştir. Lazer tarama sistemleri ile taranan nesneler 3B nokta bulutuna dönüştürülmüş ve bu verilerin sanal ortama aktarılması ile farklı veri setleri elde edilmiştir. 3B noktasal verileri derin ağlar ile başarılı bir şekilde sınıflandırmak için geliştirilen yöntemler detaylı olarak incelenmiştir. Nokta bulutlarına 3B koordinat sistemi ile birlikte farklı bilgiler dâhil ederek (derinlik ya da RGB(red-green-blue)) farklı boyutlarda veya farklı yoğunlukta nokta bulutları oluşturulmuştur. Ayrıca nokta bulutu veri kümesindeki her bir noktaya ait; harici veya dâhili bilgiler eklenmiş RGB değerleri ile nesneler renklendirilmiştir. Bu araştırmada 3B nokta bulutunu derin ağlar ile sınıflandıran yöntemlerin başarı performansları, avantajları, dezavantajları analiz edilmiştir. Özellikle uygulanan algoritmalar, denenen yöntemler ve oluşturulan modeller karşılaştırılmış ve tartışılmıştır. Son olarak makalede gelecekteki çalışmalara hız ve yön vermesi için güncel yöntemler kapsamlı bir şekilde sunulmuştur.

Anahtar Kelimeler

Kaynakça

  1. [1] Qi, C. R., Su, H., Mo, K., & Guibas, L. J. (2017’a). PointNet: Deep learning on point sets for 3D classification and segmentation. Proceedings -30th IEEE Conference on Computer Vision and Pattern Recognition, CVPR 2017, 2017-January, 77–85. https://doi.org/10.1109/CVPR.2017.16
  2. [2] Qi, C. R., Yi, L., Su, H., & Guibas, L. J. (2017). PointNet++: Deep hierarchical feature learning on point sets in a metric space. ArXiv, (Nips).
  3. [3] Mccarthy, T., Fotheringham, A. S., Charlton, M., Winstanley, A., & Malley, V. O. (2007). Integration of LiDAR and stereoscopic imagery for route corridor surveying. ANational Centre for Geocomputation, National University of Ireland, Maynooth.
  4. [4] Chang, A. X., Funkhouser, T., Guibas, L., Hanrahan, P., Huang, Q., Li, Z., … Yu, F. (2015). ShapeNet: An Information-Rich 3D Model Repository. Retrieved from http://arxiv.org/abs/1512.03012.
  5. [5] Wu, Z., Song, S., Khosla, A., Yu, F., Zhang, L., Tang, X., & Xiao, J. (2015). 3D ShapeNets: A deep representation for volumetric shapes. Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 07-12-June, 1912–1920. https://doi.org/10.1109/CVPR.2015.7298801.
  6. [6] Dai, A., Chang, A. X., Savva, M., Halber, M., Funkhouser, T., & Nießner, M. (2017). ScanNet: Richly-annotated 3D reconstructions of indoor scenes. ArXiv.
  7. [7] Geiger, A., Lenz, P., Stiller, C., & Urtasun, R. (2013). Vision meets robotics: The KITTI dataset. International Journal of Robotics Research, 32(11), 1231–1237.
  8. [8] Kesten, R., Usman, M., Houston, J., Pandya, T., Nadhamuni, K., Ferreira, A., … Shet, V. (2019). Lyft Level 5 AV Dataset 2019. Retrieved from https://level5.lyft.com/ dataset/2020.

Ayrıntılar

Birincil Dil

Türkçe

Konular

-

Bölüm

Derleme

Yayımlanma Tarihi

30 Mart 2022

Gönderilme Tarihi

3 Şubat 2022

Kabul Tarihi

25 Mart 2022

Yayımlandığı Sayı

Yıl 2022 Cilt: 13 Sayı: 1

Kaynak Göster

IEEE
[1]M. A. Demirtaş, “Derin öğrenme ile 3B nokta bulutlarının sınıflandırılmasına genel bir bakış”, DÜMF MD, c. 13, sy 1, ss. 1–9, Mar. 2022, doi: 10.24012/dumf.1067736.

Cited By

DUJE tarafından yayınlanan tüm makaleler, Creative Commons Atıf 4.0 Uluslararası Lisansı ile lisanslanmıştır. Bu, orijinal eser ve kaynağın uygun şekilde belirtilmesi koşuluyla, herkesin eseri kopyalamasına, yeniden dağıtmasına, yeniden düzenlemesine, iletmesine ve uyarlamasına izin verir. 24456