TY - JOUR T1 - Continuous time threshold selection for binary classification on polarized data TT - Kutuplaştırılmış veri üzerinde ikili sınıflandırma için sürekli zamanlı eşik değeri belirleme AU - Sağlam, Ali AU - Akhan Baykan, Nurdan PY - 2019 DA - October JF - Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi PB - Pamukkale Üniversitesi WT - DergiPark SN - 2147-5881 SP - 596 EP - 602 VL - 25 IS - 5 LA - en AB - Binaryclassification is used to distinguish some of the data elements from others ina meaningful way according to certain characteristics.  Supervised classification techniques oftenuse the ground-truth data, which assists to determine the distinctive characteristicsof the elements to be extracted from the data. These techniques also generatenew features for all of the data using the current features in accordance withthe ground-truth data. One of the purposes of generating new features is topolarize the data elements (to be extracted and others) toward the separatepools on a coordinate axis for binary classification. In this way, the binaryclassification process is easy using only a threshold value on the axis. Inthis work, the Linear Discriminant Analysis (LDA) is used to polarize the dataand a threshold selection algorithm is proposed, which use the harmonic meanF-score values of the binary classification outputs resulting from somespecific threshold values. The key condition in the proposed method is that themost suitable threshold must give the best classification score (F-score value)and other threshold values must give lower classification scores as they becomedistant from the best threshold value (move away toward the ends of the axis).The proposed method is experimented for binary classifications of somemeaningful elements on a remote sensing image taken from a 2D semanticlabelling dataset that has the ground-truth images. The proposed methodconvergences the best threshold value continuously in logarithmic time. KW - Classification KW - Threshold KW - LDA KW - F-score N2 - İkilisınıflandırma, veri elemanlarından bir kısmını belirli karakteristiklerine görediğerlerinden anlamlı bir şekilde ayırmak için kullanılmaktadır. Denetimlisınıflandırma teknikleri ise genellikle veriden çıkarılacak elemanların ayırtedici karakteristiklerini belirlemeye yardımcı olan referans veriyikullanmaktadır. Bu teknikler aynı zamanda mevcut özellikleri kullanarak bütünveri için referans veriye uygun olarak yeni özellikler oluşturmaktadır. Yeniözellikler oluşturmanın amaçlarından birisi de çıkarılacak veri elemanlarını vediğerlerini ikili sınıflandırma için bir koordinat ekseni üzerinde ayrıkutuplara doğru kutuplaştırmaktır. Bu şekilde, sadece bir eksen üzerinde eşikdeğeri kullanarak, ikili sınıflandırma işlemi kolaylaşmaktadır. Bu çalışmada,veriyi kutuplaştırmak için doğrusal ayrıştırma analizi (DAA) kullanılmış vebazı belirli eşik değerleriyle elde edilen ikili sınıflandırma çıktılarınınharmonik ortalama F-score değerlerini kullanan bir eşik değeri belirlemealgoritması önerilmiştir. Önerilen metottaki anahtar durum, en uygun eşikdeğeri en iyi sınıflandırma başarısını (F-score değerini) vermeli ve diğer eşikdeğerleri en iyi eşik değerinden uzaklaştıkça (eksenin iki ucuna doğruilerledikçe) daha düşük sınıflandırma başarısını vermelidir. Önerilen metot,referans görüntüleri de içeren bir 2D anlamsal etiketleme veri kümesindenalınan bir uzaktan algılama görüntüsü üzerinde bazı anlamlı verilerin ikilisınıflandırması için uygulanmıştır. Önerilen metot en iyi eşik değerine süreklizamanlı olarak belirlenen örnekleme sayısına ve sonlanma ölçütüne görelogaritmik zamanda yakınsamaktadır. CR - Lu D, Weng Q. “A survey of image classification methods and techniques for improving classification performance”. International Journal of Remote Sensing, 28(5), 823-870, 2007. CR - Wang W, Yang N, Zhang Y, Wang F, Cao T, Eklund P. “A review of road extraction from remote sensing images”. Journal of Traffic and Transportation Engineering, 3(3), 271-282, 2016. CR - Saglam A, Baykan NA. “A satellite image classification approach by using one dimensional discriminant analysis”. ISPRS-International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, XLII-3/W4, 429-435, 2018. CR - Fisher RA. “The use of multiple measures in taxonomic problems”. Annals of Eugenics, 7(2), 179-188, 1936. CR - Duda RO, Hart PE, Stork DG. Pattern Classification. New York, USA, Wiley, 2000. CR - Martis RJ, Acharya UR, Min LC. “ECG beat classification using PCA, LDA, ICA and discrete wavelet transform”. Biomedical Signal Processing and Control, 8(5), 437-448, 2013. CR - Lipton ZC, Elkan C, Naryanaswamy B. “Optimal thresholding of classifiers to maximize F1 measure”. Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 8725(2), 225-239, 2014. CR - Sanchez IE, Belgium A, Brun M. “Optimal threshold estimation for binary classifiers using game theory”. International Society for Computational Biology Community Journal, 5(5), 1-11, 2016. CR - Weinmann M, Jutzi B, Hinz S, Mallet C. “Semantic point cloud interpretation based on optimal neighborhoods, relevant features and efficient classifiers”. ISPRS Journal of Photogrammetry and Remote Sensing, 105, 286-304, 2015. CR - Landrieu L, Raguet H, Vallet B, Mallet C, Weinmann M. “A structured regularization framework for spatially smoothing semantic labelings of 3D point clouds”. ISPRS Journal of Photogrammetry and Remote Sensing, 132, 102-118, 2017. CR - Sokolova M, Lapalme G. “A systematic analysis of performance measures for classification tasks”. Information Processing and Management, 45(4), 427-437, 2009. CR - Baldi P, Brunak S, Chauvin Y, Andersen CAF, Nielsen H. “Assessing the accuracy of prediction algorithms for classification: An overview”. Bioinformatics, 16(5), 412-424, 2000. CR - Freeman EA, Moisen GG. “A comparison of the performance of threshold criteria for binary classification in terms of predicted prevalence and kappa”. Ecological Modelling, 217(1-2), 48-58, 2008. CR - 2D Semantic Labeling Contest” “Online”. http://www2.isprs.org/commissions/comm3/wg4/semantic-labeling.html (2018). CR - Gerke M. “Use of the Stair Vision Library within the ISPRS 2D Semantic Labeling Benchmark (Vaihingen)”. Department of Earth Observation Science, University of Twente, Enschede, Netherlands, Technical Report, 2015. CR - Rottensteiner F, Sohn G, Gerke M, Baillard C, Benitez S, Breitkopf U. “ISPRS Test Project on Urban Classification and 3D Building Reconstruction”. ISPRS Annals of the Photogrammetry, Remote Sensing and Spatial Information Sciences, I-3, 293-298, 2012. UR - https://dergipark.org.tr/tr/pub/pajes/issue//635251 L1 - https://dergipark.org.tr/tr/download/article-file/834927 ER -