Bu çalışmada, İngilizce film açıklamalarının altı farklı türde (aksiyon, komedi, romantik, bilim kurgu, drama, animasyon) otomatik olarak sınıflandırılması hedeflenmiştir. Dengeli dağılıma sahip veri kümesi, doğal dil işleme (NLP) teknikleri ile işlenmiştir. İlk aşamada, FastText’in önceden eğitilmiş kelime gömme vektörleri kullanılarak açıklamalardaki anlamsal olarak düşük benzerlik gösteren kelimeler filtrelenmiş, böylece her tür için bağlama özgü içerik korunarak metinsel verinin kalitesi artırılmıştır. Bu ön işleme adımının ardından, metinlerin sayısal temsili TF-IDF (Term Frequency–Inverse Document Frequency) yöntemiyle elde edilmiştir. TF-IDF, sık tekrar eden ancak ayırt edici gücü düşük kelimelerin etkisini azaltarak sınıflandırma algoritmalarına daha anlamlı öznitelikler sunmaktadır. Elde edilen vektörler, Softmax Regresyon, Multinomial Naive Bayes, Destek Vektör Makineleri, Rastgele Orman ve Çok Katmanlı Algılayıcı modelleri ile sınıflandırılmış; sırasıyla %89,07, %89,75, %89,75, %85,40 ve %90,02 doğruluk oranlarına ulaşılmıştır. FastText tabanlı anlamsal kelime filtreleme ile TF-IDF vektörlerinin birleştirilmesi, çok sınıflı metin sınıflandırma problemleri için etkili bir çözüm sunmuştur. Ayrıca, farklı makine öğrenmesi algoritmalarının karşılaştırılması yoluyla model seçimine yönelik ampirik katkı sağlanmış olup , anlamca sadeleştirilmiş açıklamaların model başarısını olumlu etkilediği gösterilmiştir. Bu yönüyle çalışma, metin ön işleme sürecine yenilikçi bir yaklaşım getirmektedir.
Doğal Dil İşleme FastText Kelime Gömmesi MEtin Sınıflandırma TF-IDF
Birincil Dil | Türkçe |
---|---|
Konular | Bilgisayar Yazılımı |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 30 Ağustos 2025 |
Gönderilme Tarihi | 20 Haziran 2025 |
Kabul Tarihi | 4 Ağustos 2025 |
Yayımlandığı Sayı | Yıl 2025 Cilt: 41 Sayı: 2 |
✯ Etik kurul izni gerektiren, tüm bilim dallarında yapılan araştırmalar için etik kurul onayı alınmış olmalı, bu onay makalede belirtilmeli ve belgelendirilmelidir.
✯ Etik kurul izni gerektiren araştırmalarda, izinle ilgili bilgilere (kurul adı, tarih ve sayı no) yöntem bölümünde, ayrıca makalenin ilk/son sayfalarından birinde; olgu sunumlarında, bilgilendirilmiş gönüllü olur/onam formunun imzalatıldığına dair bilgiye makalede yer verilmelidir.
✯ Dergi web sayfasında, makalelerde Araştırma ve Yayın Etiğine uyulduğuna dair ifadeye yer verilmelidir.
✯ Dergi web sayfasında, hakem, yazar ve editör için ayrı başlıklar altında etik kurallarla ilgili bilgi verilmelidir.
✯ Dergide ve/veya web sayfasında, ulusal ve uluslararası standartlara atıf yaparak, dergide ve/veya web sayfasında etik ilkeler ayrı başlık altında belirtilmelidir. Örneğin; dergilere gönderilen bilimsel yazılarda, ICMJE (International Committee of Medical Journal Editors) tavsiyeleri ile COPE (Committee on Publication Ethics)’un Editör ve Yazarlar için Uluslararası Standartları dikkate alınmalıdır.
✯ Kullanılan fikir ve sanat eserleri için telif hakları düzenlemelerine riayet edilmesi gerekmektedir.