İkili
sınıflandırma, veri elemanlarından bir kısmını belirli karakteristiklerine göre
diğerlerinden anlamlı bir şekilde ayırmak için kullanılmaktadır. Denetimli
sınıflandırma teknikleri ise genellikle veriden çıkarılacak elemanların ayırt
edici karakteristiklerini belirlemeye yardımcı olan referans veriyi
kullanmaktadır. Bu teknikler aynı zamanda mevcut özellikleri kullanarak bütün
veri için referans veriye uygun olarak yeni özellikler oluşturmaktadır. Yeni
özellikler oluşturmanın amaçlarından birisi de çıkarılacak veri elemanlarını ve
diğerlerini ikili sınıflandırma için bir koordinat ekseni üzerinde ayrı
kutuplara doğru kutuplaştırmaktır. Bu şekilde, sadece bir eksen üzerinde eşik
değeri kullanarak, ikili sınıflandırma işlemi kolaylaşmaktadır. Bu çalışmada,
veriyi kutuplaştırmak için doğrusal ayrıştırma analizi (DAA) kullanılmış ve
bazı belirli eşik değerleriyle elde edilen ikili sınıflandırma çıktılarının
harmonik ortalama F-score değerlerini kullanan bir eşik değeri belirleme
algoritması önerilmiştir. Önerilen metottaki anahtar durum, en uygun eşik
değeri en iyi sınıflandırma başarısını (F-score değerini) vermeli ve diğer eşik
değerleri en iyi eşik değerinden uzaklaştıkça (eksenin iki ucuna doğru
ilerledikçe) daha düşük sınıflandırma başarısını vermelidir. Önerilen metot,
referans görüntüleri de içeren bir 2D anlamsal etiketleme veri kümesinden
alınan bir uzaktan algılama görüntüsü üzerinde bazı anlamlı verilerin ikili
sınıflandırması için uygulanmıştır. Önerilen metot en iyi eşik değerine sürekli
zamanlı olarak belirlenen örnekleme sayısına ve sonlanma ölçütüne göre
logaritmik zamanda yakınsamaktadır.
Binary
classification is used to distinguish some of the data elements from others in
a meaningful way according to certain characteristics. Supervised classification techniques often
use the ground-truth data, which assists to determine the distinctive characteristics
of the elements to be extracted from the data. These techniques also generate
new features for all of the data using the current features in accordance with
the ground-truth data. One of the purposes of generating new features is to
polarize the data elements (to be extracted and others) toward the separate
pools on a coordinate axis for binary classification. In this way, the binary
classification process is easy using only a threshold value on the axis. In
this work, the Linear Discriminant Analysis (LDA) is used to polarize the data
and a threshold selection algorithm is proposed, which use the harmonic mean
F-score values of the binary classification outputs resulting from some
specific threshold values. The key condition in the proposed method is that the
most suitable threshold must give the best classification score (F-score value)
and other threshold values must give lower classification scores as they become
distant from the best threshold value (move away toward the ends of the axis).
The proposed method is experimented for binary classifications of some
meaningful elements on a remote sensing image taken from a 2D semantic
labelling dataset that has the ground-truth images. The proposed method
convergences the best threshold value continuously in logarithmic time.
Birincil Dil | İngilizce |
---|---|
Konular | Mühendislik |
Bölüm | Makale |
Yazarlar | |
Yayımlanma Tarihi | 21 Ekim 2019 |
Yayımlandığı Sayı | Yıl 2019 Cilt: 25 Sayı: 5 |