Veri madenciliği literatürdeki en önemli araştırma alanlarından biridir. Teknolojik gelişmelerle doğru orantılı olarak artan veri hacmi nedeniyle bu alanda yapılan araştırmaların sayısı da hızla artmaktadır. Veri madenciliğinin amacı, makine öğrenimi tekniklerinden yararlanarak çeşitli tahminlerde bulunmak ve ham verilerden bilgi elde etmektir. Makine öğrenmesi tekniklerinde kullanılan veri kümelerinin yapısal özellikleri ve sınıf dağılımları algoritmaların performanslarını önemli ölçüde etkilemektedir. Bu çalışmada amacımız, dengesiz ikili veri kümelerini, çokyüzlü konik fonksiyonların kullanıldığı bir sınıflandırma yöntemini içeren yeni bir alt örnekleme yaklaşımıyla dengelemektir.
Veri madenciliği makine öğrenme alt örnekleme çokyüzlü konik fonksiyonlar.
Data mining is one of the most important research area in literature. Due to the increasing volume of data, which is directly proportional to technological advancements, the number of researches in this field is growing rapidly. The goal of data mining is to extract various insights and obtain information from raw data by leveraging machine learning techniques. The structural characteristics and also class distributions of the datasets used in machine learning techniques significantly affect the performances of the algorithms. In this study, our aim is balancing the imbalanced binary dataset, used in the machine learning techniques, with an undersampling approach including a classification method via polyhedral conic functions.
Data mining machine learning undersamling polyhedral conic functions
Birincil Dil | İngilizce |
---|---|
Konular | Sayısal Hesaplama ve Matematiksel Yazılım, Büyük ve Karmaşık Veri Teorisi, Matematikte Optimizasyon |
Bölüm | Araştırma Makalesi |
Yazarlar | |
Erken Görünüm Tarihi | 14 Temmuz 2024 |
Yayımlanma Tarihi | 15 Temmuz 2024 |
Gönderilme Tarihi | 5 Mart 2024 |
Kabul Tarihi | 6 Haziran 2024 |
Yayımlandığı Sayı | Yıl 2024 |