Araştırma Makalesi

Türkçe Faturaların Sınıflandırılmasında Farklı Öznitelik Seçimi Yöntemleri ile Topluluk Öğrenme Algoritmalarının Etkilerinin İncelenmesi

Sayı: 52 15 Aralık 2023
PDF İndir
EN TR

Türkçe Faturaların Sınıflandırılmasında Farklı Öznitelik Seçimi Yöntemleri ile Topluluk Öğrenme Algoritmalarının Etkilerinin İncelenmesi

Öz

Özellikle Covid-19 pandemisiyle birlikte insanların alışveriş tercihlerinin daha çok dijital ortamlara geçmesiyle birlikte şirketler ve tedarik zincirleri de ciddi manada genişledi. Bu genişleme beraberinde fatura sayılarında da artışı getiriyor. Kanunen fiziki faturaların dijitalleştirilmesi ve saklanması zorunlu hale geldi. Bu zorunlulukla beraber dijitalleşmiş faturaların otomatik olarak sınıflandırılması ve gerekli durumlarda istenilen bilgilerin otomatik olarak çıkartılması çok önemli bir ihtiyaç haline gelmiştir. Özellikle İngilizce dilindeki ve diğer dillerdeki faturaların otomatik yöntemlerle analiz edilmesi için farklı öğrenme algoritmaları içeren çeşitli çalışmalar yapılmıştır. Ancak Türkçe dilindeki faturaların otomatik olarak analiz edilmesi ve sınıflandırılması için yeterli miktarda çalışma ve kamuya açık veri kümesi olmadığı görülmektedir. Bu motivasyonla yola çıkarak bu çalışmada, farklı özellik seçimi yöntemlerinin Türkçe dilindeki faturaların topluluk öğrenme modelleri ile sınıflandırılması problemi üzerindeki performansını analiz etmeyi amaçladık. Deneylerimizi oluşturduğumuz 15k ve 50k boyutlarındaki 2 adet veri kümesi üzerinde gerçekleştirdik. Bu veri kümeleri üzerinde Bilgi Kazancı, Chi Kare, Kazanç Oranı, Geriye Beslemeli özellik seçimi yöntemlerinin K-En Yakın Komşu (KNN), Destek Vektör Makineleri (DVM), Naif Bayes (NB), Rassal Orman (RO), Adaboost topluluk öğrenme sınıflandırma algoritmalarının ve Serpme (Sprinkling) tekniğinin performans etkilerini gözlemledik. Deneysel sonuçlara göre en yüksek sınıflandırma başarısı Geriye Beslemeli özellik seçimi yöntemi ve Adaboost topluluk öğrenme algoritmasının birlikte kullanılması ile elde edilmiştir. Bildiğimiz kadarıyla bu çalışma Serpme (Sprinkling) tekniğinin topluluk öğrenme algoritmalarıyla beraber Türkçe faturaların sınıflandırılması probleminin çözümü üzerine ve bu kapsamda yapılmış ilk çalışma olma özelliğini taşımaktadır. Türkçe fatura analizi ile ilgili kaynakların yetersiz olmasından ötürü Türkçe fatura analizi üzerine yapılan çalışmalar da oldukça kısıtlı sayıdadır. Dolayısıyla, Türkçe fatura sınıflandırması alanında literatüre katkıda bulunabilmek için bu çalışmada kullanılan veri kümeleri ve geliştirilmiş algoritmalar diğer araştırmacıların erişimine açık hale getirilmiştir.

Anahtar Kelimeler

Kaynakça

  1. M. B. Wattar, "Analysis and Comparison of invoice data extraction methods," Doctoral dissertation, PhD thesis, University of Applied Sciences, 2021.Lee, K.-F., Automatic Speech Recognition: The Development of the SPHINX SYSTEM, Kluwer Academic Publishers, Boston, 1989.
  2. A. Khan, "Comparison of machine learning approaches for classification of invoices," Master's thesis, 2020.
  3. Ö. Arslan, "Evrişimsel sinir ağları ve metin benzerliği kullanılarak fatura görüntülerinde sınıflandırma," Master's thesis, Konya Teknik Üniversitesi, 2021.
  4. K. M. Yindumathi, S. S. Chaudhari and R. Aparna, "Analysis of Image Classification for Text Extraction from Bills and Invoices," 11th International Conference on Computing, Communication and Networking Technologies (ICCCNT), Kharagpur, India, 2020, pp. 1-6, doi: 10.1109/ICCCNT49239.2020.9225564.
  5. D. Kılınç, "The effect of ensemble learning models on Turkish text classification," Celal Bayar University Journal of Science, vol. 12, no. 2, 2016.
  6. Y. Wang, J. Liu, and L. Feng, "Text length considered adaptive bagging ensemble learning algorithm for text classification," Multimedia Tools and Applications, pp. 1-26, 2023.
  7. Ö. Arslan and S. A. Uymaz , "Classification of Invoice Images By Using Convolutional Neural Networks", Journal of Advanced Research in Natural and Applied Sciences, vol. 8, no. 1, pp. 8-25, Mar. 2022, doi:10.28979/jarnas.953634
  8. A. S. Tarawneh, A. B. Hassanat, D. Chetverikov, I. Lendak and C. Verma, "Invoice Classification Using Deep Features and Machine Learning Techniques", 2019 IEEE Jordan International Joint Conference on Electrical Engineering and Information Technology

Ayrıntılar

Birincil Dil

Türkçe

Konular

Elektronik Belge Yönetim Sistemleri, Bilgi Sistemleri (Diğer), Makine Öğrenme (Diğer), Veri Madenciliği ve Bilgi Keşfi

Bölüm

Araştırma Makalesi

Erken Görünüm Tarihi

28 Aralık 2023

Yayımlanma Tarihi

15 Aralık 2023

Gönderilme Tarihi

15 Ağustos 2023

Kabul Tarihi

5 Aralık 2023

Yayımlandığı Sayı

Yıl 2023 Sayı: 52

Kaynak Göster

APA
Yıldız, İ., Kotan, A. E., & Altınel, A. B. (2023). Türkçe Faturaların Sınıflandırılmasında Farklı Öznitelik Seçimi Yöntemleri ile Topluluk Öğrenme Algoritmalarının Etkilerinin İncelenmesi. Avrupa Bilim ve Teknoloji Dergisi, 52, 272-278. https://izlik.org/JA92TK62RA
AMA
1.Yıldız İ, Kotan AE, Altınel AB. Türkçe Faturaların Sınıflandırılmasında Farklı Öznitelik Seçimi Yöntemleri ile Topluluk Öğrenme Algoritmalarının Etkilerinin İncelenmesi. EJOSAT. 2023;(52):272-278. https://izlik.org/JA92TK62RA
Chicago
Yıldız, İlker, Ayberk Emin Kotan, ve Ayşe Berna Altınel. 2023. “Türkçe Faturaların Sınıflandırılmasında Farklı Öznitelik Seçimi Yöntemleri ile Topluluk Öğrenme Algoritmalarının Etkilerinin İncelenmesi”. Avrupa Bilim ve Teknoloji Dergisi, sy 52: 272-78. https://izlik.org/JA92TK62RA.
EndNote
Yıldız İ, Kotan AE, Altınel AB (01 Aralık 2023) Türkçe Faturaların Sınıflandırılmasında Farklı Öznitelik Seçimi Yöntemleri ile Topluluk Öğrenme Algoritmalarının Etkilerinin İncelenmesi. Avrupa Bilim ve Teknoloji Dergisi 52 272–278.
IEEE
[1]İ. Yıldız, A. E. Kotan, ve A. B. Altınel, “Türkçe Faturaların Sınıflandırılmasında Farklı Öznitelik Seçimi Yöntemleri ile Topluluk Öğrenme Algoritmalarının Etkilerinin İncelenmesi”, EJOSAT, sy 52, ss. 272–278, Ara. 2023, [çevrimiçi]. Erişim adresi: https://izlik.org/JA92TK62RA
ISNAD
Yıldız, İlker - Kotan, Ayberk Emin - Altınel, Ayşe Berna. “Türkçe Faturaların Sınıflandırılmasında Farklı Öznitelik Seçimi Yöntemleri ile Topluluk Öğrenme Algoritmalarının Etkilerinin İncelenmesi”. Avrupa Bilim ve Teknoloji Dergisi. 52 (01 Aralık 2023): 272-278. https://izlik.org/JA92TK62RA.
JAMA
1.Yıldız İ, Kotan AE, Altınel AB. Türkçe Faturaların Sınıflandırılmasında Farklı Öznitelik Seçimi Yöntemleri ile Topluluk Öğrenme Algoritmalarının Etkilerinin İncelenmesi. EJOSAT. 2023;:272–278.
MLA
Yıldız, İlker, vd. “Türkçe Faturaların Sınıflandırılmasında Farklı Öznitelik Seçimi Yöntemleri ile Topluluk Öğrenme Algoritmalarının Etkilerinin İncelenmesi”. Avrupa Bilim ve Teknoloji Dergisi, sy 52, Aralık 2023, ss. 272-8, https://izlik.org/JA92TK62RA.
Vancouver
1.İlker Yıldız, Ayberk Emin Kotan, Ayşe Berna Altınel. Türkçe Faturaların Sınıflandırılmasında Farklı Öznitelik Seçimi Yöntemleri ile Topluluk Öğrenme Algoritmalarının Etkilerinin İncelenmesi. EJOSAT [Internet]. 01 Aralık 2023;(52):272-8. Erişim adresi: https://izlik.org/JA92TK62RA