Araştırma Makalesi

OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin kNN Yöntemi İle Tahmini

Cilt: 9 Sayı: 4 31 Ağustos 2021
PDF İndir
EN TR

OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin kNN Yöntemi İle Tahmini

Öz

Ekonomik İşbirliği ve Kalkınma Örgütü (OECD), daha iyi yaşamlar oluşturmak için çalışan uluslararası bir organizasyondur. Bu amaç doğrultusunda OECD ülkeler hakkında birçok göstergede veri toplamaktadır. Daha doğru analizler yapabilmek için bu verilerin eksiksiz olması gerekmektedir. Fakat ulusal ve uluslararası farklı kaynaklardan toplanan bilgilerde eksiklikler olmaktadır. Bu eksiklikler özellikle istatiksel analiz ve makine öğrenmesi yöntemleri kullanarak çalışmak isteyen araştırmacılara problem çıkartmaktadır. Bu tür analizler için veri setlerinin öncelikle eksik verilerden temizlenmesi gerekmektedir. Genel olarak eksik veriler istatistiksel analizleri üzerinde olumsuz bir etkiye sahiptir. Bu sorunu çözmek için geleneksel ve modern yöntemler vardır. Değişkenler tamamen rastgele eksik (MCAR), rastgele eksik (MAR) ve rastgele eksik değil (MNAR) olabilir. Bu neden ile her değişken ayrı ayrı ele alınmalıdır. Temel Ekonomik Göstergeler veri tabanı içerisindeki endüstriyel üretim başlıklı veriler setinde 34 ülkeye ait 113 eksik veri ve 3933 tam veri olmak üzere 4046 değer bulunmaktadır. Veri setini farklı gruplara ayırmak için çalışmada k-en yakın komşu (kNN) adı verilen makine öğrenimi algoritmasını kullanılmış. kNN algoritması kullanımının basit olduğundan yaygın olarak kullanılmaktadır. Çalışmada kullanılan algoritmaya ait en yakın komşuluk değeri k=15 olarak belirlenmiştir. Eksik verileri tahmin etmede %86,8’lik bir başarı elde edilmiştir.

Anahtar Kelimeler

Kaynakça

  1. Andridge, R.R. & Little, R.J.A. (2010). A Review of Hot Deck Imputation for Survey Non-response, Int Stat Rev.,78(1), 40–64.
  2. Batista, G.E.A.P.A. & Monard, M.C. (2002). A study of K-nearest neighbour as an imputation method, Brazilian Research Councils, 1-10.
  3. Chen, J. & Shao, J., 2000. Nearest neighbor imputation for survey data. Journal of Official Statistics, 16(2), 113–131.
  4. Choudhury, A. & Kosorok, M.R. (2020). Missing data imputation for classication problems. National Cancer Institute, 1-27.
  5. Çilingirtürk, A.M. & Altaş, D. (2010). Makro iktisat verilerinde kayıp verilerin regresyona dayalı en yakın komşu “Hot Deck” yöntemi ile tamamlanması. Dokuz Eylül Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, 25(2), 73-83.
  6. Dondersa, A.R.T., Heijdenc, G.J.M.G., Stijnend, T., & Moons, K.G.M. (2006). Review: A gentle introduction to imputation of missing values. Journal of Clinical Epidemiology, 59, 1087-1091.
  7. Fendoğlu, E. (2020). Metasezgisel yöntemlerle rotalama problemlerinin çözümü için çok aşamalı bir yaklaşım. Ankara: Gazi Kitabevi
  8. Folch-Fortuny, A., Arteaga, F., & Ferrer, A. (2016). Missing data imputation toolbox for MATLAB. Chemometrics and Intelligent Laboratory Systems 154, 93–100.

Ayrıntılar

Birincil Dil

Türkçe

Konular

-

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

31 Ağustos 2021

Gönderilme Tarihi

1 Mart 2021

Kabul Tarihi

14 Nisan 2021

Yayımlandığı Sayı

Yıl 2021 Cilt: 9 Sayı: 4

Kaynak Göster

APA
Metin, S. (2021). OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin kNN Yöntemi İle Tahmini. Anemon Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi, 9(4), 955-967. https://doi.org/10.18506/anemon.888642
AMA
1.Metin S. OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin kNN Yöntemi İle Tahmini. Anemon Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi. 2021;9(4):955-967. doi:10.18506/anemon.888642
Chicago
Metin, Serkan. 2021. “OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin kNN Yöntemi İle Tahmini”. Anemon Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi 9 (4): 955-67. https://doi.org/10.18506/anemon.888642.
EndNote
Metin S (01 Ağustos 2021) OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin kNN Yöntemi İle Tahmini. Anemon Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi 9 4 955–967.
IEEE
[1]S. Metin, “OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin kNN Yöntemi İle Tahmini”, Anemon Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi, c. 9, sy 4, ss. 955–967, Ağu. 2021, doi: 10.18506/anemon.888642.
ISNAD
Metin, Serkan. “OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin kNN Yöntemi İle Tahmini”. Anemon Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi 9/4 (01 Ağustos 2021): 955-967. https://doi.org/10.18506/anemon.888642.
JAMA
1.Metin S. OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin kNN Yöntemi İle Tahmini. Anemon Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi. 2021;9:955–967.
MLA
Metin, Serkan. “OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin kNN Yöntemi İle Tahmini”. Anemon Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi, c. 9, sy 4, Ağustos 2021, ss. 955-67, doi:10.18506/anemon.888642.
Vancouver
1.Serkan Metin. OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin kNN Yöntemi İle Tahmini. Anemon Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi. 01 Ağustos 2021;9(4):955-67. doi:10.18506/anemon.888642

Anemon Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı (CC BY NC) ile lisanslanmıştır.