Research Article

NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması

Volume: 8 Number: 2 June 28, 2020

NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması

Öz

Teknoloji ile birlikte hayatımıza birçok yeni kavram girmiştir. Bu yeniliklerden biri de Doğal Dil İşleme (DDİ) kavramıdır. Bu kavram beraberinde birçok çalışma alanı getirdiği için Doğal Dil İşleme ile yapılan çalışmalar gün geçtikçe artmaktadır. Bu çalışmada, Doğal Dil işleme kullanılarak elektronik ortamlardaki haberlerin yaş gruplarına göre etiketlenmesi amaçlanmıştır. Haber sitelerinden toplanan haber veri setinin eğitim amaçlı seçilmiş olanları, NLP Zemberek Kütüphanesi kullanılarak Python dili ile işlenmiş, Havighurst’ün “Gelişim Kuramı” nın güncel duruma adapte edilmiş Çocukluk, Ergenlik ve Yetişkinlik yaş gruplarını temsil edebilecek kelime sözlüğü oluşturulmuştur (her kelimenin hangi yaş grubuna uygun olduğu). Daha sonra, bu sözlük kullanılarak haber veri setinin test amaçlı seçilmiş olanlarının sınıflarını belirlemek üzere bir sınıflandırıcı önerilmiştir. Testler sonucunda, geliştirilen sözlüğün 0.70 oranında doğru sınıfı tespit edebildiği görülmüştür.

Anahtar Kelimeler

References

  1. [1] Akın A.A., Akın M. D. Zemberek, an open source NLP framework for Turkic Languages, (2007).
  2. [2]Hürriyet, 21 Eylül 2019, Erişim adresi: www.hurriyet.com
  3. [3]Yumurtalı Ekmek, 21 Eylül 2019, Erişim adresi: www.yumurtaliekmek.com
  4. [4] Çok F. Gelişim psikolojisi, kuramlar, yöntemler ve yaşamın ilk yılları (kısaltarak çeviri), Ankara Üniversitesi Eğitim Bilimleri Fakültesi Dergisi, 2 (26), s. 641-670, DOI: 10.1501/Egifak_0000000479, (1993).
  5. [5] Fırat F. Çocuk odak‘sız’ habercilik: internet gazetelerinde çocuk içerikli haberlerin sunumu ve etik ihlaller, Gümüşhane Üniversitesi İletişim Fakültesi Elektronik Dergisi, 2(4), (2016).
  6. [6] Oflazer K. Türkçe ve Doğal Dil İşleme (Turkish Natural Language Processing), Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 2(5), (2012).
  7. [7] Silverman K., Anderson V., Bellegarda J., Lenzo K. and Naik D. Design and Collection of a Corpus of Polyphones And Prosodic Contexts for Speech Synthesis Research and Development, (1999).
  8. [8] Riloff E. Automatically Generating Extraction Patterns From Untagged Text, AAAI'96: Proceedings of the thirteenth national conference on Artificial intelligence, Vol. 2, s. 1044–1049, (1996).

Details

Primary Language

Turkish

Subjects

Engineering

Journal Section

Research Article

Publication Date

June 28, 2020

Submission Date

February 7, 2020

Acceptance Date

April 29, 2020

Published in Issue

Year 2020 Volume: 8 Number: 2

APA
Kontuk, R., & Turan, M. (2020). NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması. Gazi Üniversitesi Fen Bilimleri Dergisi Part C: Tasarım Ve Teknoloji, 8(2), 372-382. https://doi.org/10.29109/gujsc.686177

Cited By

                                TRINDEX     16167        16166    21432    logo.png

      

    e-ISSN:2147-9526