EN
TR
Kısa Metinleri Yazıldıkları Dile Göre Sınıflandırma ve Farklı Öznitelik Seçim Yöntemlerinin Uygulanması
Öz
Bu çalışmada Wikipedia makale özetlerinden oluşan farklı boyutlardaki iki veri seti üzerinde dil tanımaya yönelik sınıflandırma işlemi yapılmıştır. A veri seti grubu 204 bayt ve daha kısa makale özetlerinden oluşurken, B veri seti grubu 204 ile 512 bayt arasındaki özetlerden oluşmaktadır. Çalışmadaki birinci hedef kısa metinlerin boyutlarına göre uygun makine öğrenmesi ve öznitelik seçme yönteminin belirlenmesidir. İkinci hedef ise en hızlı ve yüksek doğrulukla sınıflandırma yapan yöntemin tespit edilmesidir. Yapılan testler sonucunda öznitelik seçiminde SelectFromModel-Lojistik Regresyon kullanılması ile en yüksek doğruluk değerine ulaşılırken, makine öğrenmesi yöntemi olarak Naive Bayes Multinominal ve Naive Bayes Bernoilli farklı uzunluktaki veri setlerine göre birbirlerine üstünlük sağlamaktadır. Ayrıca çalışmada kullanılan tüm sınıflandırma yöntemleri ile yapılan testler sonucunda, her iki veri setinde diğer sınıflandırma yöntemlerine göre fasttext’in doğruluk bakımından, KTİY’nin ise hız bakımından üstünlük sağladığı anlaşılmıştır
Anahtar Kelimeler
Teşekkür
“IOCENS21” konferans kapsamında ek sayı için değerlendirilmek üzere yüklenmiştir.
Kaynakça
- Gülşen, E., Gündüz, H., Cataltepe, Z., & Serinol, L. (2015, May). Big data feature selection and projection for gender prediction based on user web behaviour. In 2015 23nd Signal Processing and Communications Applications Conference (SIU) (pp. 1545-1548). IEEE.
- Yengi, Y., & Omurca, S. İ. (2015). Lojistik Regresyonun Özellik Azaltma Teknikleri ile Gen Dizilimlerinin Sınıflandırılmasındaki Başarısı. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 8(1), 1-12.
- Parlar, T., Saraç, E., & Özel, S. A. (2017, May). Comparison of feature selection methods for sentiment analysis on Turkish Twitter data. In 2017 25th Signal Processing and Communications Applications Conference (SIU) (pp. 1-4). IEEE.
- Sel, İ., Karci, A., & Hanbay, D. (2019, September). Feature Selection for Text Classification Using Mutual Information. In 2019 International Artificial Intelligence and Data Processing Symposium (IDAP) (pp. 1-4). IEEE.
- Erdem, H., & Özgur, A. (2018). Feature selection and multiple classifier fusion using genetic algorithms in intrusion detection systems. Journal of the Faculty of Engineering and Architecture of Gazi University 33:1, 75-87.
- Akyol, K. (2018). Meme Kanseri Tanısı İçin Özniteliklerin Öneminin Değerlendirilmesi Üzerine Bir Çalışma. Akademik Platform Mühendislik ve Fen Bilimleri Dergisi, 6(2), 109-115.
- Ataş, P. K., Tufan, K., & Şevkli, A. Z. (2016, April). A variable neighborhood search based feature selection model for early prediction of the Alzhemier's disease. In 2016 Electric Electronics, Computer Science, Biomedical Engineerings' Meeting (EBBT) (pp. 1-4). IEEE.
- Kaya, Y., Ertuğrul, Ö. F., & Tekin, R. (2015). Doküman dili tanıma için ikili örüntüler tabanlı yeni bir yaklaşım. Akademik Bilişim, Eskişehir.
Ayrıntılar
Birincil Dil
Türkçe
Konular
-
Bölüm
Araştırma Makalesi
Yayımlanma Tarihi
31 Aralık 2021
Gönderilme Tarihi
27 Eylül 2021
Kabul Tarihi
23 Aralık 2021
Yayımlandığı Sayı
Yıl 2021 Cilt: 4 Sayı: 2
APA
Aslanyürek, M., & Mesut, A. (2021). Kısa Metinleri Yazıldıkları Dile Göre Sınıflandırma ve Farklı Öznitelik Seçim Yöntemlerinin Uygulanması. Journal of Investigations on Engineering and Technology, 4(2), 36-46. https://izlik.org/JA37UL56UW
AMA
1.Aslanyürek M, Mesut A. Kısa Metinleri Yazıldıkları Dile Göre Sınıflandırma ve Farklı Öznitelik Seçim Yöntemlerinin Uygulanması. JIET. 2021;4(2):36-46. https://izlik.org/JA37UL56UW
Chicago
Aslanyürek, Murat, ve Altan Mesut. 2021. “Kısa Metinleri Yazıldıkları Dile Göre Sınıflandırma ve Farklı Öznitelik Seçim Yöntemlerinin Uygulanması”. Journal of Investigations on Engineering and Technology 4 (2): 36-46. https://izlik.org/JA37UL56UW.
EndNote
Aslanyürek M, Mesut A (01 Aralık 2021) Kısa Metinleri Yazıldıkları Dile Göre Sınıflandırma ve Farklı Öznitelik Seçim Yöntemlerinin Uygulanması. Journal of Investigations on Engineering and Technology 4 2 36–46.
IEEE
[1]M. Aslanyürek ve A. Mesut, “Kısa Metinleri Yazıldıkları Dile Göre Sınıflandırma ve Farklı Öznitelik Seçim Yöntemlerinin Uygulanması”, JIET, c. 4, sy 2, ss. 36–46, Ara. 2021, [çevrimiçi]. Erişim adresi: https://izlik.org/JA37UL56UW
ISNAD
Aslanyürek, Murat - Mesut, Altan. “Kısa Metinleri Yazıldıkları Dile Göre Sınıflandırma ve Farklı Öznitelik Seçim Yöntemlerinin Uygulanması”. Journal of Investigations on Engineering and Technology 4/2 (01 Aralık 2021): 36-46. https://izlik.org/JA37UL56UW.
JAMA
1.Aslanyürek M, Mesut A. Kısa Metinleri Yazıldıkları Dile Göre Sınıflandırma ve Farklı Öznitelik Seçim Yöntemlerinin Uygulanması. JIET. 2021;4:36–46.
MLA
Aslanyürek, Murat, ve Altan Mesut. “Kısa Metinleri Yazıldıkları Dile Göre Sınıflandırma ve Farklı Öznitelik Seçim Yöntemlerinin Uygulanması”. Journal of Investigations on Engineering and Technology, c. 4, sy 2, Aralık 2021, ss. 36-46, https://izlik.org/JA37UL56UW.
Vancouver
1.Murat Aslanyürek, Altan Mesut. Kısa Metinleri Yazıldıkları Dile Göre Sınıflandırma ve Farklı Öznitelik Seçim Yöntemlerinin Uygulanması. JIET [Internet]. 01 Aralık 2021;4(2):36-4. Erişim adresi: https://izlik.org/JA37UL56UW