Research Article

OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin kNN Yöntemi İle Tahmini

Volume: 9 Number: 4 August 31, 2021
EN TR

OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin kNN Yöntemi İle Tahmini

Abstract

Ekonomik İşbirliği ve Kalkınma Örgütü (OECD), daha iyi yaşamlar oluşturmak için çalışan uluslararası bir organizasyondur. Bu amaç doğrultusunda OECD ülkeler hakkında birçok göstergede veri toplamaktadır. Daha doğru analizler yapabilmek için bu verilerin eksiksiz olması gerekmektedir. Fakat ulusal ve uluslararası farklı kaynaklardan toplanan bilgilerde eksiklikler olmaktadır. Bu eksiklikler özellikle istatiksel analiz ve makine öğrenmesi yöntemleri kullanarak çalışmak isteyen araştırmacılara problem çıkartmaktadır. Bu tür analizler için veri setlerinin öncelikle eksik verilerden temizlenmesi gerekmektedir. Genel olarak eksik veriler istatistiksel analizleri üzerinde olumsuz bir etkiye sahiptir. Bu sorunu çözmek için geleneksel ve modern yöntemler vardır. Değişkenler tamamen rastgele eksik (MCAR), rastgele eksik (MAR) ve rastgele eksik değil (MNAR) olabilir. Bu neden ile her değişken ayrı ayrı ele alınmalıdır. Temel Ekonomik Göstergeler veri tabanı içerisindeki endüstriyel üretim başlıklı veriler setinde 34 ülkeye ait 113 eksik veri ve 3933 tam veri olmak üzere 4046 değer bulunmaktadır. Veri setini farklı gruplara ayırmak için çalışmada k-en yakın komşu (kNN) adı verilen makine öğrenimi algoritmasını kullanılmış. kNN algoritması kullanımının basit olduğundan yaygın olarak kullanılmaktadır. Çalışmada kullanılan algoritmaya ait en yakın komşuluk değeri k=15 olarak belirlenmiştir. Eksik verileri tahmin etmede %86,8’lik bir başarı elde edilmiştir.

Keywords

References

  1. Andridge, R.R. & Little, R.J.A. (2010). A Review of Hot Deck Imputation for Survey Non-response, Int Stat Rev.,78(1), 40–64.
  2. Batista, G.E.A.P.A. & Monard, M.C. (2002). A study of K-nearest neighbour as an imputation method, Brazilian Research Councils, 1-10.
  3. Chen, J. & Shao, J., 2000. Nearest neighbor imputation for survey data. Journal of Official Statistics, 16(2), 113–131.
  4. Choudhury, A. & Kosorok, M.R. (2020). Missing data imputation for classication problems. National Cancer Institute, 1-27.
  5. Çilingirtürk, A.M. & Altaş, D. (2010). Makro iktisat verilerinde kayıp verilerin regresyona dayalı en yakın komşu “Hot Deck” yöntemi ile tamamlanması. Dokuz Eylül Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, 25(2), 73-83.
  6. Dondersa, A.R.T., Heijdenc, G.J.M.G., Stijnend, T., & Moons, K.G.M. (2006). Review: A gentle introduction to imputation of missing values. Journal of Clinical Epidemiology, 59, 1087-1091.
  7. Fendoğlu, E. (2020). Metasezgisel yöntemlerle rotalama problemlerinin çözümü için çok aşamalı bir yaklaşım. Ankara: Gazi Kitabevi
  8. Folch-Fortuny, A., Arteaga, F., & Ferrer, A. (2016). Missing data imputation toolbox for MATLAB. Chemometrics and Intelligent Laboratory Systems 154, 93–100.

Details

Primary Language

Turkish

Subjects

-

Journal Section

Research Article

Publication Date

August 31, 2021

Submission Date

March 1, 2021

Acceptance Date

April 14, 2021

Published in Issue

Year 2021 Volume: 9 Number: 4

APA
Metin, S. (2021). OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin kNN Yöntemi İle Tahmini. Anemon Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi, 9(4), 955-967. https://doi.org/10.18506/anemon.888642
AMA
1.Metin S. OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin kNN Yöntemi İle Tahmini. Anemon Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi. 2021;9(4):955-967. doi:10.18506/anemon.888642
Chicago
Metin, Serkan. 2021. “OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin KNN Yöntemi İle Tahmini”. Anemon Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi 9 (4): 955-67. https://doi.org/10.18506/anemon.888642.
EndNote
Metin S (August 1, 2021) OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin kNN Yöntemi İle Tahmini. Anemon Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi 9 4 955–967.
IEEE
[1]S. Metin, “OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin kNN Yöntemi İle Tahmini”, Anemon Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi, vol. 9, no. 4, pp. 955–967, Aug. 2021, doi: 10.18506/anemon.888642.
ISNAD
Metin, Serkan. “OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin KNN Yöntemi İle Tahmini”. Anemon Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi 9/4 (August 1, 2021): 955-967. https://doi.org/10.18506/anemon.888642.
JAMA
1.Metin S. OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin kNN Yöntemi İle Tahmini. Anemon Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi. 2021;9:955–967.
MLA
Metin, Serkan. “OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin KNN Yöntemi İle Tahmini”. Anemon Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi, vol. 9, no. 4, Aug. 2021, pp. 955-67, doi:10.18506/anemon.888642.
Vancouver
1.Serkan Metin. OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin kNN Yöntemi İle Tahmini. Anemon Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi. 2021 Aug. 1;9(4):955-67. doi:10.18506/anemon.888642