Araştırma Makalesi
BibTex RIS Kaynak Göster

NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması

Yıl 2020, , 372 - 382, 28.06.2020
https://doi.org/10.29109/gujsc.686177

Öz

Teknoloji ile birlikte hayatımıza birçok yeni kavram girmiştir. Bu yeniliklerden biri de Doğal Dil İşleme (DDİ) kavramıdır. Bu kavram beraberinde birçok çalışma alanı getirdiği için Doğal Dil İşleme ile yapılan çalışmalar gün geçtikçe artmaktadır. Bu çalışmada, Doğal Dil işleme kullanılarak elektronik ortamlardaki haberlerin yaş gruplarına göre etiketlenmesi amaçlanmıştır. Haber sitelerinden toplanan haber veri setinin eğitim amaçlı seçilmiş olanları, NLP Zemberek Kütüphanesi kullanılarak Python dili ile işlenmiş, Havighurst’ün “Gelişim Kuramı” nın güncel duruma adapte edilmiş Çocukluk, Ergenlik ve Yetişkinlik yaş gruplarını temsil edebilecek kelime sözlüğü oluşturulmuştur (her kelimenin hangi yaş grubuna uygun olduğu). Daha sonra, bu sözlük kullanılarak haber veri setinin test amaçlı seçilmiş olanlarının sınıflarını belirlemek üzere bir sınıflandırıcı önerilmiştir. Testler sonucunda, geliştirilen sözlüğün 0.70 oranında doğru sınıfı tespit edebildiği görülmüştür.

Kaynakça

  • [1] Akın A.A., Akın M. D. Zemberek, an open source NLP framework for Turkic Languages, (2007).
  • [2]Hürriyet, 21 Eylül 2019, Erişim adresi: www.hurriyet.com
  • [3]Yumurtalı Ekmek, 21 Eylül 2019, Erişim adresi: www.yumurtaliekmek.com
  • [4] Çok F. Gelişim psikolojisi, kuramlar, yöntemler ve yaşamın ilk yılları (kısaltarak çeviri), Ankara Üniversitesi Eğitim Bilimleri Fakültesi Dergisi, 2 (26), s. 641-670, DOI: 10.1501/Egifak_0000000479, (1993).
  • [5] Fırat F. Çocuk odak‘sız’ habercilik: internet gazetelerinde çocuk içerikli haberlerin sunumu ve etik ihlaller, Gümüşhane Üniversitesi İletişim Fakültesi Elektronik Dergisi, 2(4), (2016).
  • [6] Oflazer K. Türkçe ve Doğal Dil İşleme (Turkish Natural Language Processing), Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 2(5), (2012).
  • [7] Silverman K., Anderson V., Bellegarda J., Lenzo K. and Naik D. Design and Collection of a Corpus of Polyphones And Prosodic Contexts for Speech Synthesis Research and Development, (1999).
  • [8] Riloff E. Automatically Generating Extraction Patterns From Untagged Text, AAAI'96: Proceedings of the thirteenth national conference on Artificial intelligence, Vol. 2, s. 1044–1049, (1996).
  • [9] Këpuska V. Z., Rojanasthien P. Speech Corpus Generation from DVDs of Movies and TV Series, Journal of International Technology and Information Management: Vol. 20: Iss. 1, Article 4. (2011).
  • [10] Tsalidis Ch., Vagelatos A. and Orphanos G. An electronic dictionary as a basis for NLP tools: TheGreek case, ArXiv cs.CL/0408061 (2004).
  • [11] Aktaş Y., Yılmaz İnce E., Çakır A. Doğal Dil İşleme Kullanarak Bilgisayar Ağ Terimlerinin Wordnet Ontolojisinde Uyarlanması, SDÜ Teknik Bilimler Dergisi, (2017).
  • [12] Şeker S. E. Doğal Dil İşleme(Natural Language Processing), Yönetim Bilişim Sistemleri Ansiklopedisi, 4(2), (2015).
  • [13] Khurana D., Koli A., Khatter K., Singh S. Natural Language Processing: State of The Art, Current Trends and Challenges, ArXiv abs/1708.05148 (2017).
  • [14] Adalı E. Doğal Dil İşleme, Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 2(5), (2012).
  • [15] Aliz, 01 Şubat2020, Erişim adresi: https://aliz.ai/natural-language-processing-a-short-introduction-to-get-you-started/
  • [16] Binici K. Kütüphane ve Bilgi Biliminde Tema ve Yönelim, Hiper yayın, s. 41-84, İstanbul, (2018).
  • [17] İlhan U. Application Of K-NN and FPTC Based Text Categorization Algorithms to Turkish News Reports, (2001).
  • [18] GitHup, 20 Eylül 2019, Erişim adresi: https://github.com/ahmetaa/zemberek-nlp
  • [19] WordNet, 03 Şubat 2020, Erişim adresi: https://wordnet.princeton.edu/
  • [20] Uludoğan G., Özçelik R., Parlar S., Ercan G., Yıldız O. T. User Interfaces for Turkish Natural Language Processing, (2019).
  • [21] Eryiğit G. ITU Turkish NLP Web Service, s. 1-4, DOI: 10.3115/v1/E14-2001, (2014).
Toplam 21 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Mühendislik
Bölüm Tasarım ve Teknoloji
Yazarlar

Rabia Kontuk 0000-0002-2132-0973

Metin Turan 0000-0002-1941-6693

Yayımlanma Tarihi 28 Haziran 2020
Gönderilme Tarihi 7 Şubat 2020
Yayımlandığı Sayı Yıl 2020

Kaynak Göster

APA Kontuk, R., & Turan, M. (2020). NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması. Gazi Üniversitesi Fen Bilimleri Dergisi Part C: Tasarım Ve Teknoloji, 8(2), 372-382. https://doi.org/10.29109/gujsc.686177

                                     16168      16167     16166     21432        logo.png   


    e-ISSN:2147-9526