Research Article

Makine Öğrenmesinde Kategorik Veri Kodlama Tekniğinin Kullanımına Alternatif Bir Çözüm Yöntemi

Volume: 6 Number: 1 March 15, 2023
TR EN

Makine Öğrenmesinde Kategorik Veri Kodlama Tekniğinin Kullanımına Alternatif Bir Çözüm Yöntemi

Abstract

Makine öğrenimi, derin öğrenme algoritmaları kullanarak insan zekâsını taklit eden bir teknolojidir. Öğrenme algoritmaları yalnızca sayısal veri kümeleri üzerinde çalışır. Kategorik veri kümeleri nitel veya nicel verilerden oluşur. Nitel veri setlerinin öğrenme algoritmalarında kullanılabilmesi için veri setinin sayısallaştırılması gerekmektedir. Sayısallaştırma için etiket kodlama, sıralı kodlama, toplam kodlama, ikili kodlama ve sıcak kodlama gibi birçok kodlama tekniği vardır ancak bu kodlama teknikleri performans, maliyet ve kullanım açısından bazı güçlükler ve yetersizlikleri barındırmaktadır. Diğer taraftan bir kodlama tekniği ile elde edilen eğitim çıktısının orijinalinin bilinmesine ihtiyaç duyulabilmektedir. Bu çalışma, kategorik verilerin sayısallaştırılmasında kodlama tekniklerinin kullanılmasından kaynaklanan yetersizliklere çözüm olabilecek, daha özgün ve daha iyi performansa sahip bir altyapı oluşturma arayışının bir sonucu olarak ortaya çıkmıştır. Geliştirilen yöntem uluslararası bir lojistik firmada 7 farklı kategoride toplam 46 kategorik özellik ve 80.154.139 adet veri üzerinden uygulanmıştır. Testlerin sonucuna göre veri setleri bazında %23.07 ile %300.13 arasında toplamda %153.62 performans kazancı elde edilmiştir. Bu sonuçlar, geliştirilen yöntemin daha başarılı ve uygulanabilir olduğunu göstermektedir. Çalışma, yüksek performans kazancı ve özgün yapısı ile benzer alanlarda kolaylıkla kullanılabilecek bir yapıya sahiptir. Makine öğrenmesinde kodlama tekniklerinin kullanımına alternatif bir çözüm sunmuştur.

Keywords

References

  1. Al-Shehari T., Alsowail R. A., 2021. An insider data leakage detection using one-hot encoding, synthetic minority oversampling and machine learning techniques. Entropy, 23(10), 1258, doi:10.3390/e23101258
  2. Bilgin, T., Oğuz, M., 2021. A new approach to minimize memory requirements of frequent subgraph mining algorithms. Politeknik Dergisi, 24(1), 237-246
  3. Calp, M., Akcayol, M., 2020. Design and Implementation of Web Based Risk Management System Based on Artificial Neural Networks for Software Projects: WEBRISKIT. Pamukkale Univ Muh Bilim Derg., 26(5), 993-1014
  4. Chakrabarty, N., 2019. A data mining approach to flight arrival delay prediction for american airlines. 9th Annual Information Technology, Electromechanical Engineering and Microelectronics Conference (IEMECON). doi:10.1109/iemeconx.2019.8876970
  5. Cerda, P., Varoquaux, G., Kégl, B., 2018. Similarity encoding for learning with dirty categorical variables. Machine Learning, 107(8-10), 1477–1494. doi:10.1007/s10994-018-5724-2
  6. Chandradeva, L. S., Jayasooriya, I., Aponso, A. C., 2019. Fraud Detection Solution for Monetary Transactions with Autoencoders. National Information Technology Conference(NITC). doi:10.1109/nitc48475.2019.9114519
  7. Chen, L., Xian, M., Liu, J., & Wang, H., 2020. Intrusion detection system in cloud computing environment. International Conference on Computer Communication and Network Security (CCNS). doi:10.1109/ccns50731. 2020.00037
  8. Famili, A., Shen, W.-M., Weber, R., Simoudis, E., 1997. Data preprocessing and ıntelligent data analysis. Intelligent Data Analysis, 1(1), 3–23. doi:10.3233/ida-1997-1102

Details

Primary Language

Turkish

Subjects

Artificial Intelligence, Computer Software

Journal Section

Research Article

Publication Date

March 15, 2023

Submission Date

July 4, 2022

Acceptance Date

November 7, 2022

Published in Issue

Year 2023 Volume: 6 Number: 1

APA
Şahinaslan, E., Günerkan, M., & Şahinaslan, Ö. (2023). Makine Öğrenmesinde Kategorik Veri Kodlama Tekniğinin Kullanımına Alternatif Bir Çözüm Yöntemi. Journal of Intelligent Systems: Theory and Applications, 6(1), 1-11. https://doi.org/10.38016/jista.1140499
AMA
1.Şahinaslan E, Günerkan M, Şahinaslan Ö. Makine Öğrenmesinde Kategorik Veri Kodlama Tekniğinin Kullanımına Alternatif Bir Çözüm Yöntemi. JISTA. 2023;6(1):1-11. doi:10.38016/jista.1140499
Chicago
Şahinaslan, Ender, Mustafa Günerkan, and Önder Şahinaslan. 2023. “Makine Öğrenmesinde Kategorik Veri Kodlama Tekniğinin Kullanımına Alternatif Bir Çözüm Yöntemi”. Journal of Intelligent Systems: Theory and Applications 6 (1): 1-11. https://doi.org/10.38016/jista.1140499.
EndNote
Şahinaslan E, Günerkan M, Şahinaslan Ö (March 1, 2023) Makine Öğrenmesinde Kategorik Veri Kodlama Tekniğinin Kullanımına Alternatif Bir Çözüm Yöntemi. Journal of Intelligent Systems: Theory and Applications 6 1 1–11.
IEEE
[1]E. Şahinaslan, M. Günerkan, and Ö. Şahinaslan, “Makine Öğrenmesinde Kategorik Veri Kodlama Tekniğinin Kullanımına Alternatif Bir Çözüm Yöntemi”, JISTA, vol. 6, no. 1, pp. 1–11, Mar. 2023, doi: 10.38016/jista.1140499.
ISNAD
Şahinaslan, Ender - Günerkan, Mustafa - Şahinaslan, Önder. “Makine Öğrenmesinde Kategorik Veri Kodlama Tekniğinin Kullanımına Alternatif Bir Çözüm Yöntemi”. Journal of Intelligent Systems: Theory and Applications 6/1 (March 1, 2023): 1-11. https://doi.org/10.38016/jista.1140499.
JAMA
1.Şahinaslan E, Günerkan M, Şahinaslan Ö. Makine Öğrenmesinde Kategorik Veri Kodlama Tekniğinin Kullanımına Alternatif Bir Çözüm Yöntemi. JISTA. 2023;6:1–11.
MLA
Şahinaslan, Ender, et al. “Makine Öğrenmesinde Kategorik Veri Kodlama Tekniğinin Kullanımına Alternatif Bir Çözüm Yöntemi”. Journal of Intelligent Systems: Theory and Applications, vol. 6, no. 1, Mar. 2023, pp. 1-11, doi:10.38016/jista.1140499.
Vancouver
1.Ender Şahinaslan, Mustafa Günerkan, Önder Şahinaslan. Makine Öğrenmesinde Kategorik Veri Kodlama Tekniğinin Kullanımına Alternatif Bir Çözüm Yöntemi. JISTA. 2023 Mar. 1;6(1):1-11. doi:10.38016/jista.1140499

Cited By

Journal of Intelligent Systems: Theory and Applications