In recent times, astronomy has entered a new era with rapidly growing data sources and advanced observation techniques. The construction of powerful telescopes has enabled the collection of spectral data from millions of celestial objects. However, the increasing number and variety of data have made it challenging to categorize these celestial objects. This study employs machine learning methods to address the fundamental problem of classifying stars, galaxies, and quasars in astronomy. The dataset underwent detailed preprocessing to identify effective features for classification. KNIME Analytics Platform was used for data analysis and visualization, facilitating rapid and efficient data analysis through its drag-and-drop interface. Among the machine learning methods used in our study—Decision Trees, Random Forest, and Naive Bayes—the highest accuracy rate of 97.86% was achieved with the Random Forest model. Notably, despite its lower overall performance compared to other models, the Naive Bayes classifier exhibited superior performance in distinguishing the STAR class, which is one of the study's interesting findings. Future studies aim to enhance model accuracy by using larger and more diverse datasets and exploring different machine learning algorithms. Additionally, the impact of deep learning methods on classification performance will be investigated.
Classification Decision Tree Random Forest Naive Bayes Knime
Son dönemde astronomi, hızla büyüyen veri kaynakları ve gelişmiş gözlem teknikleriyle yeni bir döneme girmiştir. Güçlü teleskopların yapılandırılmasıyla milyonlarca gök cisminin spektral verileri toplanabilmektedir. Ancak veri sayısının ve çeşitliliğinin artmasıyla gök cisimlerini kategorize etmek de zorlaşmıştır. Bu çalışmada astronomide temel bir problem olan yıldız, galaksi ve kuasarları sınıflandırmak için makine öğrenmesi yöntemlerini kullanılmıştır. Veri seti, sınıflandırmada etkili öznitelikleri ortaya çıkarmak için ayrıntılı bir veri önişlemeden geçirilmiştir. Veri analizi ve görselleştirme için KNIME Analytics Platformu kullanılmış, sürükle-bırak arayüzü sayesinde verilerin hızlı ve etkin bir şekilde analiz edilmesi sağlanmıştır. Makine öğrenmesi yöntemlerinden Karar Ağaçları, Rastgele Orman ve Naive Bayes’in kullanıldığı çalışmamızda en yüksek doğruluk oranı %97,86 ile Rastgele Orman modelinden elde edilmiştir. Diğer modellere göre performansı daha düşük olan Naive Bayes sınıflandırıcısının ise STAR sınıfını ayırt etmedeki üstün performansı ise çalışmanın dikkat çekici sonuçlarından biridir. Gelecek çalışmalarda, daha büyük ve çeşitli veri setleri kullanılarak model doğruluğunun artırılması ve farklı makine öğrenmesi algoritmalarının denenmesi planlanmaktadır. Ayrıca, derin öğrenme yöntemlerinin sınıflandırma performansını nasıl etkilediği araştırılacaktır.
sınıflandırma karar ağaçları rastgele orman naive bayes knime
Birincil Dil | İngilizce |
---|---|
Konular | İletişim Mühendisliği (Diğer) |
Bölüm | Research Articles |
Yazarlar | |
Erken Görünüm Tarihi | 4 Eylül 2024 |
Yayımlanma Tarihi | 15 Eylül 2024 |
Gönderilme Tarihi | 18 Temmuz 2024 |
Kabul Tarihi | 3 Eylül 2024 |
Yayımlandığı Sayı | Yıl 2024 Cilt: 7 Sayı: 5 |