Yapay Sinir Ağları ve K-Ortalamalar Tabanlı Büyük Veri Azaltma Algoritmasının Tasarımı ve Uygulaması
Abstract
Büyük veri azaltma sürecinde karşılaşılan başlıca zorluk, veri setinin homojenliğinin ve problem uzayını temsil yeteneğinin korunmasıdır. Bu durum, büyük veri setleri üzerinde yapılan modelleme çalışmalarında hesaplama karmaşıklığının yeterince azaltılamamasına, geliştirilen modelin orijinal veri setine dayalı olarak geliştirilen modele kıyasla kararlılık ve doğruluk performansının önemli ölçüde azalmasına neden olmaktadır. Bu makale çalışmasının amacı, büyük veri setleri için kararlı ve etkili bir şekilde çalışan veri azaltma algoritması geliştirmektir. Bu amaçla, yapay sinir ağları (YSA) tabanlı problem modelleme modülü ve K-ortalamalar tabanlı veri azaltma modülünden oluşan melez bir algoritma geliştirilmiştir. Problem modelleme modülü, büyük veri seti için performans eşik değerlerini tanımlamayı sağlamaktadır. Bu sayede, orijinal veri setinin ve veri azaltma işlemi uygulanmış veri setlerinin problem uzayını temsil yetenekleri ve kararlılıkları analiz edilmektedir. K-ortalamalar modülünün görevi ise, veri uzayını K-adet kümede gruplamayı ve bu grupların her biri için küme merkezini referans alarak kademeli olarak veri (gözlem) azaltma işlemini gerçekleştirmektir. Böylelikle, K-ortalamalar modülü ile veri azaltma işlemi uygulanırken, azaltılmış veri setlerinin performansı ise YSA modülü ile test edilmekte ve performans eşik değerlerini karşılama durumu analiz edilmektedir. Geliştirilen melez veri azaltma algoritmasının performansını test etmek ve doğrulamak amacıyla UCI Machine Learning uluslararası veri havuzunda yer alan üç farklı veri seti kullanılmıştır. Deneysel çalışma sonuçları istatistiksel olarak analiz edilmiştir. Analiz sonuçlarına göre büyük veri setlerinde kararlılık ve performans kaybı yaşanmadan %30-%40 oranları arasında veri azaltma işlemi başarılı bir şekilde gerçekleştirilmiştir.
Keywords
Supporting Institution
TÜBİTAK 2209-A Kapsamında Desteklenmiştir
Project Number
5207
References
- [1] HT. Kahraman, “A novel and powerful hybrid classifier method: Development and testing of heuristic k-nn algorithm with fuzzy distance metric,” Data & Knowledge Engineering, c. 103, ss. 44-59, 2016.
- [2] HT. Kahraman, B. Aras, & O. Yıldız. “Sınıflandırma Problemleri İçin Agde-Tabanlı Meta-Sezgisel Boyut İndirgeme Algoritmasının Geliştirilmesi,” Mühendislik Bilimleri ve Tasarım Dergisi, c. 8, s. 5, ss. 206-217, 2020.
- [3] F. Arslan, & HT. Kahraman. “Yapay zekâ tabanlı büyük veri yönetim aracı,” Journal of Investigations on Engineering and Technology, c. 2, s. 1, ss. 8-21, 2019.
- [4] Ö. Köroğlu, & HT. Kahraman. “K-Ortalamalar Tabanlı En Etkili Meta-Sezgisel Kümeleme Algoritmasının Araştırılması,” Mühendislik Bilimleri ve Tasarım Dergisi, c. 8, s. 5, ss. 173-184, 2020.
- [5] N. Gokilavani and B. Bharathi, "Test case prioritization to examine software for fault detection using PCA extraction and K-means clustering with ranking," Soft Computing, vol. 25, no. 7, pp. 5163-5172, 2021.
- [6] M. Sivaguru and M. Punniyamoorthy, "Performance-enhanced rough k k-means clustering algorithm," Soft Computing, vol. 25, no. 2, pp. 1595-1616, 2021.
- [7] Z. Wang, Y. Zhou, and G. Li, "Anomaly Detection by Using Streaming K-Means and Batch K-Means," 2020 5th IEEE International Conference on Big Data Analytics (ICBDA). IEEE, vol. 5, pp. 11-17, 2020.
- [8] Y. Li, and H. Wu, "A clustering method based on K-means algorithm," Physics Procedia vol. 25, pp. 1104-1109, 2012.
Details
Primary Language
Turkish
Subjects
Engineering
Journal Section
Research Article
Publication Date
December 31, 2021
Submission Date
November 13, 2021
Acceptance Date
December 16, 2021
Published in Issue
Year 2021 Volume: 9 Number: 6
APA
Temel, S., & Kahraman, H. (2021). Yapay Sinir Ağları ve K-Ortalamalar Tabanlı Büyük Veri Azaltma Algoritmasının Tasarımı ve Uygulaması. Duzce University Journal of Science and Technology, 9(6), 329-342. https://doi.org/10.29130/dubited.1014161
AMA
1.Temel S, Kahraman H. Yapay Sinir Ağları ve K-Ortalamalar Tabanlı Büyük Veri Azaltma Algoritmasının Tasarımı ve Uygulaması. DUBİTED. 2021;9(6):329-342. doi:10.29130/dubited.1014161
Chicago
Temel, Seyithan, and Hamdi Kahraman. 2021. “Yapay Sinir Ağları Ve K-Ortalamalar Tabanlı Büyük Veri Azaltma Algoritmasının Tasarımı Ve Uygulaması”. Duzce University Journal of Science and Technology 9 (6): 329-42. https://doi.org/10.29130/dubited.1014161.
EndNote
Temel S, Kahraman H (December 1, 2021) Yapay Sinir Ağları ve K-Ortalamalar Tabanlı Büyük Veri Azaltma Algoritmasının Tasarımı ve Uygulaması. Duzce University Journal of Science and Technology 9 6 329–342.
IEEE
[1]S. Temel and H. Kahraman, “Yapay Sinir Ağları ve K-Ortalamalar Tabanlı Büyük Veri Azaltma Algoritmasının Tasarımı ve Uygulaması”, DUBİTED, vol. 9, no. 6, pp. 329–342, Dec. 2021, doi: 10.29130/dubited.1014161.
ISNAD
Temel, Seyithan - Kahraman, Hamdi. “Yapay Sinir Ağları Ve K-Ortalamalar Tabanlı Büyük Veri Azaltma Algoritmasının Tasarımı Ve Uygulaması”. Duzce University Journal of Science and Technology 9/6 (December 1, 2021): 329-342. https://doi.org/10.29130/dubited.1014161.
JAMA
1.Temel S, Kahraman H. Yapay Sinir Ağları ve K-Ortalamalar Tabanlı Büyük Veri Azaltma Algoritmasının Tasarımı ve Uygulaması. DUBİTED. 2021;9:329–342.
MLA
Temel, Seyithan, and Hamdi Kahraman. “Yapay Sinir Ağları Ve K-Ortalamalar Tabanlı Büyük Veri Azaltma Algoritmasının Tasarımı Ve Uygulaması”. Duzce University Journal of Science and Technology, vol. 9, no. 6, Dec. 2021, pp. 329-42, doi:10.29130/dubited.1014161.
Vancouver
1.Seyithan Temel, Hamdi Kahraman. Yapay Sinir Ağları ve K-Ortalamalar Tabanlı Büyük Veri Azaltma Algoritmasının Tasarımı ve Uygulaması. DUBİTED. 2021 Dec. 1;9(6):329-42. doi:10.29130/dubited.1014161