EN
ULUSLARARASI HABER RAPORLARININ RAPOR İÇERİKLERİNDE KULLANILAN İFADELERE GÖRE MAKİNE ÖĞRENMESİ YÖNTEMİYLE SINIFLANDIRILMASI VE DENETLENMESİ
Öz
Rapor verisinin miktarının çok olması durumunda giderek artan veri yoğunluğu içinde tasnifi ve arşivlenmesine yönelik işlemlerin yapılması zordur. Bu zorluğun aşılması, raporların denetlenmesi, düzenlenmesi ve düzeltilmesi, Karar Destek Sistemleri yollarından biri olan Makine Öğrenme ile aşılabilir. Raporların analiz edilmesi, anlamsız veriler arasından anlamlı verilerin çıkarılması, verinin kullanımı açısından büyük kolaylık sağlamaktadır. Bu yapılan araştırma, uluslararası yayın yapan büyük bir medya organının çevrimiçi olarak dünya çapında yayınladığı haber ve bilgi raporlarının makine öğrenme algoritmaları kullanılarak sınıflandırılmasına dayanmaktadır. Uygulamanın analiz aşamasında Rastgele Orman Karar Ağacı, ZeroR, Naif Bayes yöntemleri kullanılmıştır. Bu yöntemlerin sınıflandırma başarıları birbirleri ile karşılaştırılmıştır. Bunlar arasında en iyi sonuçları veren algoritma Rastgele Orman Karar Ağacı yönteminin dayandığı algoritmada parametrik değişiklikler ve düzenlemeler yapılması sonucu rapor sınıflandırmada sonuçlarda yüksek iyileştirmeler elde edilmiştir. Başarı oranı %91’e ve performans süresi 0.47s’e çıkmıştır. Araştırmadaki veri seti içerisinde her birinden 600 rapor olacak şekilde üç adet sınıf, uluslararası konularda raporlar, spor raporları, dergi (magazin) raporlarıdır. Veri setinin bir kısmı eğitim ve bir kısmı test kümesi olarak kullanılmış, 10-katlı çapraz doğrulama yöntemi ile algoritmik doğruluklar denetlenmiştir. Bu sayede, veri seti, hem test hem de eğitim kümesi olarak kullanılmıştır. Derleme ortamı olarak Weka veri madenciliği yazılımı kullanılmıştır.
Anahtar Kelimeler
Teşekkür
Prof. Dr. Kutluk Özgüven ile birlikte yazılmıştır. Değerli eğitmenime en içten teşekkürlerimi sunarım.
Kaynakça
- Abidin, S., Öztürk, Ö. ve Öztürk, T.Ö. (2017). Klasik Türk Müziğinde Makam Tanıma İçin Veri Madenciliği Kullanımı. Gazi Üniversitesi Mühendislik, Mimarlık Fakültesi Dergisi, 32(4), 1221-1232.
- Akın, Z.O. (2010). Uluslararası Haber Ajanslarının Türkiye Haberlerinde Eşik Bekçiliği Uygulamaları: Reuters ve Ap Örneği. Yüksek Lisans Tezi, Gazi Üniversitesi Sosyal Bilimler Enstitüsü, Ankara, Türkiye.
- Aslan, M. (2016). Derinlik Kamerası İle Yaşlılarda Düşme Tespiti. Doktora Tezi, Fırat Üniversitesi Fen Bilimleri Enstitüsü, Elazığ, Türkiye.
- Aydın, S. (2007). Veri Madenciliği ve Anadolu Üniversitesi Uzaktan Eğitim Sisteminde Bir Uygulama. Doktora Tezi, Anadolu Üniversitesi Sosyal Bilimler Enstitüsü, Eskişehir, Türkiye.
- Çalış, K., Gazdağı, O. ve Yıldız, O. (2013). Reklam İçerikli Epostaların Metin Madenciliği Yöntemleri ile Otomatik Tespiti. Bilişim Teknolojileri Dergisi, 6(1), 1-7.
- Ertuğrul, İ., Organ, A. ve Şavlı, A. (2012). Veri Madenciliği Uygulamasına İlişkin PAÜ Hastanesinde Hasta Profilinin Belirlenmesi. Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi, 19(2), 97-103.
- Hazım, L.R. (2018). Four Classification Methods Naïve Bayesian, Support Vector Machine, K-Nearest Neighbors and Random Forest Are Tested For Credit Card Fraud Detection. Yükseklisans Tezi, Altınbaş Üniversitesi, İstanbul, Türkiye.
- Jivani, A.G. (2011). A Comparative Study of Stemming Algorithms. International Journal of Computer Science, 2(6), 1930-1938.
Ayrıntılar
Birincil Dil
Türkçe
Konular
İşletme
Bölüm
Araştırma Makalesi
Yazarlar
Yayımlanma Tarihi
31 Temmuz 2020
Gönderilme Tarihi
19 Aralık 2019
Kabul Tarihi
10 Ağustos 2020
Yayımlandığı Sayı
Yıl 2020 Cilt: 2 Sayı: 1
APA
Durnagöl, F. (2020). ULUSLARARASI HABER RAPORLARININ RAPOR İÇERİKLERİNDE KULLANILAN İFADELERE GÖRE MAKİNE ÖĞRENMESİ YÖNTEMİYLE SINIFLANDIRILMASI VE DENETLENMESİ. TIDE AcademIA Research, 2(1), 91-110. https://izlik.org/JA23HL49UR
AMA
1.Durnagöl F. ULUSLARARASI HABER RAPORLARININ RAPOR İÇERİKLERİNDE KULLANILAN İFADELERE GÖRE MAKİNE ÖĞRENMESİ YÖNTEMİYLE SINIFLANDIRILMASI VE DENETLENMESİ. TIDE AcademIA Research. 2020;2(1):91-110. https://izlik.org/JA23HL49UR
Chicago
Durnagöl, Firdevs. 2020. “ULUSLARARASI HABER RAPORLARININ RAPOR İÇERİKLERİNDE KULLANILAN İFADELERE GÖRE MAKİNE ÖĞRENMESİ YÖNTEMİYLE SINIFLANDIRILMASI VE DENETLENMESİ”. TIDE AcademIA Research 2 (1): 91-110. https://izlik.org/JA23HL49UR.
EndNote
Durnagöl F (01 Temmuz 2020) ULUSLARARASI HABER RAPORLARININ RAPOR İÇERİKLERİNDE KULLANILAN İFADELERE GÖRE MAKİNE ÖĞRENMESİ YÖNTEMİYLE SINIFLANDIRILMASI VE DENETLENMESİ. TIDE AcademIA Research 2 1 91–110.
IEEE
[1]F. Durnagöl, “ULUSLARARASI HABER RAPORLARININ RAPOR İÇERİKLERİNDE KULLANILAN İFADELERE GÖRE MAKİNE ÖĞRENMESİ YÖNTEMİYLE SINIFLANDIRILMASI VE DENETLENMESİ”, TIDE AcademIA Research, c. 2, sy 1, ss. 91–110, Tem. 2020, [çevrimiçi]. Erişim adresi: https://izlik.org/JA23HL49UR
ISNAD
Durnagöl, Firdevs. “ULUSLARARASI HABER RAPORLARININ RAPOR İÇERİKLERİNDE KULLANILAN İFADELERE GÖRE MAKİNE ÖĞRENMESİ YÖNTEMİYLE SINIFLANDIRILMASI VE DENETLENMESİ”. TIDE AcademIA Research 2/1 (01 Temmuz 2020): 91-110. https://izlik.org/JA23HL49UR.
JAMA
1.Durnagöl F. ULUSLARARASI HABER RAPORLARININ RAPOR İÇERİKLERİNDE KULLANILAN İFADELERE GÖRE MAKİNE ÖĞRENMESİ YÖNTEMİYLE SINIFLANDIRILMASI VE DENETLENMESİ. TIDE AcademIA Research. 2020;2:91–110.
MLA
Durnagöl, Firdevs. “ULUSLARARASI HABER RAPORLARININ RAPOR İÇERİKLERİNDE KULLANILAN İFADELERE GÖRE MAKİNE ÖĞRENMESİ YÖNTEMİYLE SINIFLANDIRILMASI VE DENETLENMESİ”. TIDE AcademIA Research, c. 2, sy 1, Temmuz 2020, ss. 91-110, https://izlik.org/JA23HL49UR.
Vancouver
1.Firdevs Durnagöl. ULUSLARARASI HABER RAPORLARININ RAPOR İÇERİKLERİNDE KULLANILAN İFADELERE GÖRE MAKİNE ÖĞRENMESİ YÖNTEMİYLE SINIFLANDIRILMASI VE DENETLENMESİ. TIDE AcademIA Research [Internet]. 01 Temmuz 2020;2(1):91-110. Erişim adresi: https://izlik.org/JA23HL49UR