Araştırma Makalesi
BibTex RIS Kaynak Göster

Yıl 2025, Cilt: 41 Sayı: 2, 384 - 400, 30.08.2025

Öz

Kaynakça

  • Ramos, J. (2003). Using TF-IDF to determine word relevance in document queries. Proceedings of the First Instructional Conference on Machine Learning. https://ciir.cs.umass.edu/pubfiles/ir-88.pdf
  • Smith, A., Johnson, M., & Wang, Y. (2020). Automated movie genre classification using TF-IDF and machine learning algorithms. Multimedia Tools and Applications, 79(45-46), 33803–33824. https://doi.org/10.1007/s11042-020-09391-7
  • Çelıkten, A., & Bulut, H. (2021, June). Turkish medical text classification using bert. In 2021 29th signal processing and communications applications conference (SIU) (pp. 1-4). IEEE.
  • Özdil, U., Arslan, B., Taşar, D. E., Polat, G., & Ozan, Ş. (2021, September). Ad text classification with bidirectional encoder representations. In 2021 6th international conference on computer science and engineering (UBMK) (pp. 169-173). IEEE.
  • Yilmaz, E. H., & Toraman, C. (2021, June). Intent classification based on deep learning language model in turkish dialog systems. In 2021 29th Signal Processing and Communications Applications Conference (SIU) (pp. 1-4). IEEE.
  • Koruyan, K. (2025). Restoran Müşteri Yorumlarının Duygu Analizi: Sıfır-Atış Metin Sınıflandırma Yaklaşımı. Journal of Intelligent Systems: Theory and Applications, 8(1), 47-62.
  • Veziroğlu, M., & Bucak, İ. (2025). Haber Sınıflandırma Sistemlerinde Naive Bayes ve Makine Öğrenmesi Algoritmaları Arasında Performans Karşılaştırması. Journal of the Institute of Science and Technology, 15(1), 57-70.
  • Yiğit Açıkgöz, F. A. T. M. A., & Kayakuş, M. E. H. M. E. T. (2025). Süpermarket Zincirlerinin Mobil Uygulamalarının Kurumsal İtibarına Etkisi: Duygu Analizi ve Metin Madenciliği Yöntemleriyle Değerlendirme. SÜLEYMAN DEMIREL ÜNIVERSITESI VIZYONER DERGISI, 16(45).
  • Akgün, M. K. (2025). Otel firmalarına yapılan yorumların metin madenciliği ve derin öğrenme yöntemleri ile analizi.
  • Saka, S. O., & Cömert, Z. (2025). Sinir Ağı Dil Modelleri ve Evrensel Cümle Kodlayıcı Kullanarak Havayolu Müşteri Yorumlarının Duygu Analizi. Fırat Üniversitesi Mühendislik Bilimleri Dergisi, 37(1), 167-182.
  • Yiğidefe, G., Kaman, S. Ç., & Eken, B. (2025). Classification and Analysis of Employee Feedback with Deep Learning Algorithms. Sakarya University Journal of Computer and Information Sciences, 8(1), 38-46.
  • Camadan, E., & Şimşek, M. (2025). X Platformunda İstenmeyen Gönderilerin Makine Öğrenmesi, Geniş Dil Modelleri ve Bilgisayarlı Görü ile Tespiti. Bilişim Teknolojileri Dergisi, 18(2), 181-194.
  • AYDIN, N., ERDEM, O. A., & Tekerek, A. D. E. M. (2025). Comparative Analysis of Traditional Machine Learning and Transformer-based Deep Learning Models for Text Classification. Journal of Polytechnic, 28(2).
  • Güneş, Y., & Arıkan, M. (2025). X (Twitter) Sentiment Analysis Based on Hybrid Approach: An Application for Online Food Ordering. Bilişim Teknolojileri Dergisi, 18(2), 143-167.
  • Gao, I., Liu, G., Zhu, B., Zhou, S., Zheng, H., & Liao, X. (2025, February). Multi-level attention and contrastive learning for enhanced text classification with an optimized transformer. In 2025 5th International Conference on Consumer Electronics and Computer Engineering (ICCECE) (pp. 499-503). IEEE.
  • Zhang, Q., Chen, S., & Liu, W. (2025). Balanced Knowledge Transfer in MTTL-ClinicalBERT: A Symmetrical Multi-Task Learning Framework for Clinical Text Classification. Symmetry, 17(6), 823.
  • Jamshidi, S., Mohammadi, M., Bagheri, S., Najafabadi, H. E., Rezvanian, A., Gheisari, M., ... & Wu, Z. (2024). Effective text classification using BERT, MTM LSTM, and DT. Data & Knowledge Engineering, 151, 102306.
  • Lepagnol, P., Gerald, T., Ghannay, S., Servan, C., & Rosset, S. (2024). Small language models are good too: An empirical study of zero-shot classification. arXiv preprint arXiv:2404.11122.
  • Islam, M. T., Parvin, F., Sazan, S. A., & Amir, T. B. (2024, September). Comparative Analysis of Sentiment Classification on IMDB 50k Movie Reviews: A Study Using CNN, LSTM, CNN-LSTM, and BERT Models. In 2024 IEEE International Conference on Power, Electrical, Electronics and Industrial Applications (PEEIACON) (pp. 512-517). IEEE.
  • Emanuel, R. H., Docherty, P. D., Lunt, H., & Möller, K. (2024). The effect of activation functions on accuracy, convergence speed, and misclassification confidence in CNN text classification: a comprehensive exploration. The Journal of Supercomputing, 80(1), 292-312.
  • Cesarini, M., Malandri, L., Pallucchini, F., Seveso, A., & Xing, F. (2024). Explainable ai for text classification: Lessons from a comprehensive evaluation of post hoc methods. Cognitive Computation, 1-19.
  • Taha, K., Yoo, P. D., Yeun, C., Homouz, D., & Taha, A. (2024). A comprehensive survey of text classification techniques and their research applications: Observational and experimental insights. Computer Science Review, 54, 100664.
  • Maragheh, H. K., Gharehchopogh, F. S., Majidzadeh, K., & Sangar, A. B. (2024). A hybrid model based on convolutional neural network and long short-term memory for multi-label text classification. Neural Processing Letters, 56(2), 42
  • Singh, J., Singh, S., & Sharma, M. (2018). A comprehensive review on text mining: Techniques and applications. International Journal of Information Technology, 10(4), 491–499. https://doi.org/10.1007/s41870-018-0151-2
  • Sun, Z., Chen, Z., Liu, J., & Yu, Y. (2025). Multi-class feature selection via Sparse Softmax with a discriminative regularization. International Journal of Machine Learning and Cybernetics, 16(1), 159-172.
  • Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5–32. https://doi.org/10.1023/A:1010933404324
  • Cortes, C., & Vapnik, V. (1995). Support-vector networks. Machine Learning, 20(3), 273–297. https://doi.org/10.1007/BF00994018
  • McCallum, A., & Nigam, K. (1998). A comparison of event models for Naive Bayes text classification. AAAI-98 Workshop on Learning for Text Categorization, 752(1), 41–48.
  • Joulin, A., Grave, E., Bojanowski, P., & Mikolov, T. (2017). Bag of Tricks for Efficient Text Classification. arXiv preprint arXiv:1607.01759. https://arxiv.org/abs/1607.01759
  • Wang, S., & Manning, C. D. (2012). Baselines and Bigrams: Simple, Good Sentiment and Topic Classification. Proceedings of the 50th Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers), 90–94.
  • Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press. https://www.deeplearningbook.org/
  • fasttext.cc, “Word vectors for 157 languages”, https://dl.fbaipublicfiles.com/fasttext/vectors-crawl/cc.en.300.bin.gz (Erişim Tarihi: 10.07.2025).

Film Açıklamalarında Anlamsal Benzerlik Kullanımının Tür Sınıflandırma Performansına Etkisi

Yıl 2025, Cilt: 41 Sayı: 2, 384 - 400, 30.08.2025

Öz

Bu çalışmada, İngilizce film açıklamalarının altı farklı türde (aksiyon, komedi, romantik, bilim kurgu, drama, animasyon) otomatik olarak sınıflandırılması hedeflenmiştir. Dengeli dağılıma sahip veri kümesi, doğal dil işleme (NLP) teknikleri ile işlenmiştir. İlk aşamada, FastText’in önceden eğitilmiş kelime gömme vektörleri kullanılarak açıklamalardaki anlamsal olarak düşük benzerlik gösteren kelimeler filtrelenmiş, böylece her tür için bağlama özgü içerik korunarak metinsel verinin kalitesi artırılmıştır. Bu ön işleme adımının ardından, metinlerin sayısal temsili TF-IDF (Term Frequency–Inverse Document Frequency) yöntemiyle elde edilmiştir. TF-IDF, sık tekrar eden ancak ayırt edici gücü düşük kelimelerin etkisini azaltarak sınıflandırma algoritmalarına daha anlamlı öznitelikler sunmaktadır. Elde edilen vektörler, Softmax Regresyon, Multinomial Naive Bayes, Destek Vektör Makineleri, Rastgele Orman ve Çok Katmanlı Algılayıcı modelleri ile sınıflandırılmış; sırasıyla %89,07, %89,75, %89,75, %85,40 ve %90,02 doğruluk oranlarına ulaşılmıştır. FastText tabanlı anlamsal kelime filtreleme ile TF-IDF vektörlerinin birleştirilmesi, çok sınıflı metin sınıflandırma problemleri için etkili bir çözüm sunmuştur. Ayrıca, farklı makine öğrenmesi algoritmalarının karşılaştırılması yoluyla model seçimine yönelik ampirik katkı sağlanmış olup , anlamca sadeleştirilmiş açıklamaların model başarısını olumlu etkilediği gösterilmiştir. Bu yönüyle çalışma, metin ön işleme sürecine yenilikçi bir yaklaşım getirmektedir.

Kaynakça

  • Ramos, J. (2003). Using TF-IDF to determine word relevance in document queries. Proceedings of the First Instructional Conference on Machine Learning. https://ciir.cs.umass.edu/pubfiles/ir-88.pdf
  • Smith, A., Johnson, M., & Wang, Y. (2020). Automated movie genre classification using TF-IDF and machine learning algorithms. Multimedia Tools and Applications, 79(45-46), 33803–33824. https://doi.org/10.1007/s11042-020-09391-7
  • Çelıkten, A., & Bulut, H. (2021, June). Turkish medical text classification using bert. In 2021 29th signal processing and communications applications conference (SIU) (pp. 1-4). IEEE.
  • Özdil, U., Arslan, B., Taşar, D. E., Polat, G., & Ozan, Ş. (2021, September). Ad text classification with bidirectional encoder representations. In 2021 6th international conference on computer science and engineering (UBMK) (pp. 169-173). IEEE.
  • Yilmaz, E. H., & Toraman, C. (2021, June). Intent classification based on deep learning language model in turkish dialog systems. In 2021 29th Signal Processing and Communications Applications Conference (SIU) (pp. 1-4). IEEE.
  • Koruyan, K. (2025). Restoran Müşteri Yorumlarının Duygu Analizi: Sıfır-Atış Metin Sınıflandırma Yaklaşımı. Journal of Intelligent Systems: Theory and Applications, 8(1), 47-62.
  • Veziroğlu, M., & Bucak, İ. (2025). Haber Sınıflandırma Sistemlerinde Naive Bayes ve Makine Öğrenmesi Algoritmaları Arasında Performans Karşılaştırması. Journal of the Institute of Science and Technology, 15(1), 57-70.
  • Yiğit Açıkgöz, F. A. T. M. A., & Kayakuş, M. E. H. M. E. T. (2025). Süpermarket Zincirlerinin Mobil Uygulamalarının Kurumsal İtibarına Etkisi: Duygu Analizi ve Metin Madenciliği Yöntemleriyle Değerlendirme. SÜLEYMAN DEMIREL ÜNIVERSITESI VIZYONER DERGISI, 16(45).
  • Akgün, M. K. (2025). Otel firmalarına yapılan yorumların metin madenciliği ve derin öğrenme yöntemleri ile analizi.
  • Saka, S. O., & Cömert, Z. (2025). Sinir Ağı Dil Modelleri ve Evrensel Cümle Kodlayıcı Kullanarak Havayolu Müşteri Yorumlarının Duygu Analizi. Fırat Üniversitesi Mühendislik Bilimleri Dergisi, 37(1), 167-182.
  • Yiğidefe, G., Kaman, S. Ç., & Eken, B. (2025). Classification and Analysis of Employee Feedback with Deep Learning Algorithms. Sakarya University Journal of Computer and Information Sciences, 8(1), 38-46.
  • Camadan, E., & Şimşek, M. (2025). X Platformunda İstenmeyen Gönderilerin Makine Öğrenmesi, Geniş Dil Modelleri ve Bilgisayarlı Görü ile Tespiti. Bilişim Teknolojileri Dergisi, 18(2), 181-194.
  • AYDIN, N., ERDEM, O. A., & Tekerek, A. D. E. M. (2025). Comparative Analysis of Traditional Machine Learning and Transformer-based Deep Learning Models for Text Classification. Journal of Polytechnic, 28(2).
  • Güneş, Y., & Arıkan, M. (2025). X (Twitter) Sentiment Analysis Based on Hybrid Approach: An Application for Online Food Ordering. Bilişim Teknolojileri Dergisi, 18(2), 143-167.
  • Gao, I., Liu, G., Zhu, B., Zhou, S., Zheng, H., & Liao, X. (2025, February). Multi-level attention and contrastive learning for enhanced text classification with an optimized transformer. In 2025 5th International Conference on Consumer Electronics and Computer Engineering (ICCECE) (pp. 499-503). IEEE.
  • Zhang, Q., Chen, S., & Liu, W. (2025). Balanced Knowledge Transfer in MTTL-ClinicalBERT: A Symmetrical Multi-Task Learning Framework for Clinical Text Classification. Symmetry, 17(6), 823.
  • Jamshidi, S., Mohammadi, M., Bagheri, S., Najafabadi, H. E., Rezvanian, A., Gheisari, M., ... & Wu, Z. (2024). Effective text classification using BERT, MTM LSTM, and DT. Data & Knowledge Engineering, 151, 102306.
  • Lepagnol, P., Gerald, T., Ghannay, S., Servan, C., & Rosset, S. (2024). Small language models are good too: An empirical study of zero-shot classification. arXiv preprint arXiv:2404.11122.
  • Islam, M. T., Parvin, F., Sazan, S. A., & Amir, T. B. (2024, September). Comparative Analysis of Sentiment Classification on IMDB 50k Movie Reviews: A Study Using CNN, LSTM, CNN-LSTM, and BERT Models. In 2024 IEEE International Conference on Power, Electrical, Electronics and Industrial Applications (PEEIACON) (pp. 512-517). IEEE.
  • Emanuel, R. H., Docherty, P. D., Lunt, H., & Möller, K. (2024). The effect of activation functions on accuracy, convergence speed, and misclassification confidence in CNN text classification: a comprehensive exploration. The Journal of Supercomputing, 80(1), 292-312.
  • Cesarini, M., Malandri, L., Pallucchini, F., Seveso, A., & Xing, F. (2024). Explainable ai for text classification: Lessons from a comprehensive evaluation of post hoc methods. Cognitive Computation, 1-19.
  • Taha, K., Yoo, P. D., Yeun, C., Homouz, D., & Taha, A. (2024). A comprehensive survey of text classification techniques and their research applications: Observational and experimental insights. Computer Science Review, 54, 100664.
  • Maragheh, H. K., Gharehchopogh, F. S., Majidzadeh, K., & Sangar, A. B. (2024). A hybrid model based on convolutional neural network and long short-term memory for multi-label text classification. Neural Processing Letters, 56(2), 42
  • Singh, J., Singh, S., & Sharma, M. (2018). A comprehensive review on text mining: Techniques and applications. International Journal of Information Technology, 10(4), 491–499. https://doi.org/10.1007/s41870-018-0151-2
  • Sun, Z., Chen, Z., Liu, J., & Yu, Y. (2025). Multi-class feature selection via Sparse Softmax with a discriminative regularization. International Journal of Machine Learning and Cybernetics, 16(1), 159-172.
  • Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5–32. https://doi.org/10.1023/A:1010933404324
  • Cortes, C., & Vapnik, V. (1995). Support-vector networks. Machine Learning, 20(3), 273–297. https://doi.org/10.1007/BF00994018
  • McCallum, A., & Nigam, K. (1998). A comparison of event models for Naive Bayes text classification. AAAI-98 Workshop on Learning for Text Categorization, 752(1), 41–48.
  • Joulin, A., Grave, E., Bojanowski, P., & Mikolov, T. (2017). Bag of Tricks for Efficient Text Classification. arXiv preprint arXiv:1607.01759. https://arxiv.org/abs/1607.01759
  • Wang, S., & Manning, C. D. (2012). Baselines and Bigrams: Simple, Good Sentiment and Topic Classification. Proceedings of the 50th Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers), 90–94.
  • Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press. https://www.deeplearningbook.org/
  • fasttext.cc, “Word vectors for 157 languages”, https://dl.fbaipublicfiles.com/fasttext/vectors-crawl/cc.en.300.bin.gz (Erişim Tarihi: 10.07.2025).
Toplam 32 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Bilgisayar Yazılımı
Bölüm Makaleler
Yazarlar

Zeynep Koyun 0000-0002-4041-7818

Fatih Ahmet Şenel 0000-0003-1918-7277

Yayımlanma Tarihi 30 Ağustos 2025
Gönderilme Tarihi 20 Haziran 2025
Kabul Tarihi 4 Ağustos 2025
Yayımlandığı Sayı Yıl 2025 Cilt: 41 Sayı: 2

Kaynak Göster

APA Koyun, Z., & Şenel, F. A. (2025). Film Açıklamalarında Anlamsal Benzerlik Kullanımının Tür Sınıflandırma Performansına Etkisi. Erciyes Üniversitesi Fen Bilimleri Enstitüsü Fen Bilimleri Dergisi, 41(2), 384-400.
AMA Koyun Z, Şenel FA. Film Açıklamalarında Anlamsal Benzerlik Kullanımının Tür Sınıflandırma Performansına Etkisi. Erciyes Üniversitesi Fen Bilimleri Enstitüsü Fen Bilimleri Dergisi. Ağustos 2025;41(2):384-400.
Chicago Koyun, Zeynep, ve Fatih Ahmet Şenel. “Film Açıklamalarında Anlamsal Benzerlik Kullanımının Tür Sınıflandırma Performansına Etkisi”. Erciyes Üniversitesi Fen Bilimleri Enstitüsü Fen Bilimleri Dergisi 41, sy. 2 (Ağustos 2025): 384-400.
EndNote Koyun Z, Şenel FA (01 Ağustos 2025) Film Açıklamalarında Anlamsal Benzerlik Kullanımının Tür Sınıflandırma Performansına Etkisi. Erciyes Üniversitesi Fen Bilimleri Enstitüsü Fen Bilimleri Dergisi 41 2 384–400.
IEEE Z. Koyun ve F. A. Şenel, “Film Açıklamalarında Anlamsal Benzerlik Kullanımının Tür Sınıflandırma Performansına Etkisi”, Erciyes Üniversitesi Fen Bilimleri Enstitüsü Fen Bilimleri Dergisi, c. 41, sy. 2, ss. 384–400, 2025.
ISNAD Koyun, Zeynep - Şenel, Fatih Ahmet. “Film Açıklamalarında Anlamsal Benzerlik Kullanımının Tür Sınıflandırma Performansına Etkisi”. Erciyes Üniversitesi Fen Bilimleri Enstitüsü Fen Bilimleri Dergisi 41/2 (Ağustos2025), 384-400.
JAMA Koyun Z, Şenel FA. Film Açıklamalarında Anlamsal Benzerlik Kullanımının Tür Sınıflandırma Performansına Etkisi. Erciyes Üniversitesi Fen Bilimleri Enstitüsü Fen Bilimleri Dergisi. 2025;41:384–400.
MLA Koyun, Zeynep ve Fatih Ahmet Şenel. “Film Açıklamalarında Anlamsal Benzerlik Kullanımının Tür Sınıflandırma Performansına Etkisi”. Erciyes Üniversitesi Fen Bilimleri Enstitüsü Fen Bilimleri Dergisi, c. 41, sy. 2, 2025, ss. 384-00.
Vancouver Koyun Z, Şenel FA. Film Açıklamalarında Anlamsal Benzerlik Kullanımının Tür Sınıflandırma Performansına Etkisi. Erciyes Üniversitesi Fen Bilimleri Enstitüsü Fen Bilimleri Dergisi. 2025;41(2):384-400.

✯ Etik kurul izni gerektiren, tüm bilim dallarında yapılan araştırmalar için etik kurul onayı alınmış olmalı, bu onay makalede belirtilmeli ve belgelendirilmelidir.
✯ Etik kurul izni gerektiren araştırmalarda, izinle ilgili bilgilere (kurul adı, tarih ve sayı no) yöntem bölümünde, ayrıca makalenin ilk/son sayfalarından birinde; olgu sunumlarında, bilgilendirilmiş gönüllü olur/onam formunun imzalatıldığına dair bilgiye makalede yer verilmelidir.
✯ Dergi web sayfasında, makalelerde Araştırma ve Yayın Etiğine uyulduğuna dair ifadeye yer verilmelidir.
✯ Dergi web sayfasında, hakem, yazar ve editör için ayrı başlıklar altında etik kurallarla ilgili bilgi verilmelidir.
✯ Dergide ve/veya web sayfasında, ulusal ve uluslararası standartlara atıf yaparak, dergide ve/veya web sayfasında etik ilkeler ayrı başlık altında belirtilmelidir. Örneğin; dergilere gönderilen bilimsel yazılarda, ICMJE (International Committee of Medical Journal Editors) tavsiyeleri ile COPE (Committee on Publication Ethics)’un Editör ve Yazarlar için Uluslararası Standartları dikkate alınmalıdır.
✯ Kullanılan fikir ve sanat eserleri için telif hakları düzenlemelerine riayet edilmesi gerekmektedir.