Research Article
BibTex RIS Cite

NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması

Year 2020, Volume: 8 Issue: 2, 372 - 382, 28.06.2020
https://doi.org/10.29109/gujsc.686177

Abstract

Teknoloji ile birlikte hayatımıza birçok yeni kavram girmiştir. Bu yeniliklerden biri de Doğal Dil İşleme (DDİ) kavramıdır. Bu kavram beraberinde birçok çalışma alanı getirdiği için Doğal Dil İşleme ile yapılan çalışmalar gün geçtikçe artmaktadır. Bu çalışmada, Doğal Dil işleme kullanılarak elektronik ortamlardaki haberlerin yaş gruplarına göre etiketlenmesi amaçlanmıştır. Haber sitelerinden toplanan haber veri setinin eğitim amaçlı seçilmiş olanları, NLP Zemberek Kütüphanesi kullanılarak Python dili ile işlenmiş, Havighurst’ün “Gelişim Kuramı” nın güncel duruma adapte edilmiş Çocukluk, Ergenlik ve Yetişkinlik yaş gruplarını temsil edebilecek kelime sözlüğü oluşturulmuştur (her kelimenin hangi yaş grubuna uygun olduğu). Daha sonra, bu sözlük kullanılarak haber veri setinin test amaçlı seçilmiş olanlarının sınıflarını belirlemek üzere bir sınıflandırıcı önerilmiştir. Testler sonucunda, geliştirilen sözlüğün 0.70 oranında doğru sınıfı tespit edebildiği görülmüştür.

References

  • [1] Akın A.A., Akın M. D. Zemberek, an open source NLP framework for Turkic Languages, (2007).
  • [2]Hürriyet, 21 Eylül 2019, Erişim adresi: www.hurriyet.com
  • [3]Yumurtalı Ekmek, 21 Eylül 2019, Erişim adresi: www.yumurtaliekmek.com
  • [4] Çok F. Gelişim psikolojisi, kuramlar, yöntemler ve yaşamın ilk yılları (kısaltarak çeviri), Ankara Üniversitesi Eğitim Bilimleri Fakültesi Dergisi, 2 (26), s. 641-670, DOI: 10.1501/Egifak_0000000479, (1993).
  • [5] Fırat F. Çocuk odak‘sız’ habercilik: internet gazetelerinde çocuk içerikli haberlerin sunumu ve etik ihlaller, Gümüşhane Üniversitesi İletişim Fakültesi Elektronik Dergisi, 2(4), (2016).
  • [6] Oflazer K. Türkçe ve Doğal Dil İşleme (Turkish Natural Language Processing), Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 2(5), (2012).
  • [7] Silverman K., Anderson V., Bellegarda J., Lenzo K. and Naik D. Design and Collection of a Corpus of Polyphones And Prosodic Contexts for Speech Synthesis Research and Development, (1999).
  • [8] Riloff E. Automatically Generating Extraction Patterns From Untagged Text, AAAI'96: Proceedings of the thirteenth national conference on Artificial intelligence, Vol. 2, s. 1044–1049, (1996).
  • [9] Këpuska V. Z., Rojanasthien P. Speech Corpus Generation from DVDs of Movies and TV Series, Journal of International Technology and Information Management: Vol. 20: Iss. 1, Article 4. (2011).
  • [10] Tsalidis Ch., Vagelatos A. and Orphanos G. An electronic dictionary as a basis for NLP tools: TheGreek case, ArXiv cs.CL/0408061 (2004).
  • [11] Aktaş Y., Yılmaz İnce E., Çakır A. Doğal Dil İşleme Kullanarak Bilgisayar Ağ Terimlerinin Wordnet Ontolojisinde Uyarlanması, SDÜ Teknik Bilimler Dergisi, (2017).
  • [12] Şeker S. E. Doğal Dil İşleme(Natural Language Processing), Yönetim Bilişim Sistemleri Ansiklopedisi, 4(2), (2015).
  • [13] Khurana D., Koli A., Khatter K., Singh S. Natural Language Processing: State of The Art, Current Trends and Challenges, ArXiv abs/1708.05148 (2017).
  • [14] Adalı E. Doğal Dil İşleme, Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 2(5), (2012).
  • [15] Aliz, 01 Şubat2020, Erişim adresi: https://aliz.ai/natural-language-processing-a-short-introduction-to-get-you-started/
  • [16] Binici K. Kütüphane ve Bilgi Biliminde Tema ve Yönelim, Hiper yayın, s. 41-84, İstanbul, (2018).
  • [17] İlhan U. Application Of K-NN and FPTC Based Text Categorization Algorithms to Turkish News Reports, (2001).
  • [18] GitHup, 20 Eylül 2019, Erişim adresi: https://github.com/ahmetaa/zemberek-nlp
  • [19] WordNet, 03 Şubat 2020, Erişim adresi: https://wordnet.princeton.edu/
  • [20] Uludoğan G., Özçelik R., Parlar S., Ercan G., Yıldız O. T. User Interfaces for Turkish Natural Language Processing, (2019).
  • [21] Eryiğit G. ITU Turkish NLP Web Service, s. 1-4, DOI: 10.3115/v1/E14-2001, (2014).
Year 2020, Volume: 8 Issue: 2, 372 - 382, 28.06.2020
https://doi.org/10.29109/gujsc.686177

Abstract

References

  • [1] Akın A.A., Akın M. D. Zemberek, an open source NLP framework for Turkic Languages, (2007).
  • [2]Hürriyet, 21 Eylül 2019, Erişim adresi: www.hurriyet.com
  • [3]Yumurtalı Ekmek, 21 Eylül 2019, Erişim adresi: www.yumurtaliekmek.com
  • [4] Çok F. Gelişim psikolojisi, kuramlar, yöntemler ve yaşamın ilk yılları (kısaltarak çeviri), Ankara Üniversitesi Eğitim Bilimleri Fakültesi Dergisi, 2 (26), s. 641-670, DOI: 10.1501/Egifak_0000000479, (1993).
  • [5] Fırat F. Çocuk odak‘sız’ habercilik: internet gazetelerinde çocuk içerikli haberlerin sunumu ve etik ihlaller, Gümüşhane Üniversitesi İletişim Fakültesi Elektronik Dergisi, 2(4), (2016).
  • [6] Oflazer K. Türkçe ve Doğal Dil İşleme (Turkish Natural Language Processing), Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 2(5), (2012).
  • [7] Silverman K., Anderson V., Bellegarda J., Lenzo K. and Naik D. Design and Collection of a Corpus of Polyphones And Prosodic Contexts for Speech Synthesis Research and Development, (1999).
  • [8] Riloff E. Automatically Generating Extraction Patterns From Untagged Text, AAAI'96: Proceedings of the thirteenth national conference on Artificial intelligence, Vol. 2, s. 1044–1049, (1996).
  • [9] Këpuska V. Z., Rojanasthien P. Speech Corpus Generation from DVDs of Movies and TV Series, Journal of International Technology and Information Management: Vol. 20: Iss. 1, Article 4. (2011).
  • [10] Tsalidis Ch., Vagelatos A. and Orphanos G. An electronic dictionary as a basis for NLP tools: TheGreek case, ArXiv cs.CL/0408061 (2004).
  • [11] Aktaş Y., Yılmaz İnce E., Çakır A. Doğal Dil İşleme Kullanarak Bilgisayar Ağ Terimlerinin Wordnet Ontolojisinde Uyarlanması, SDÜ Teknik Bilimler Dergisi, (2017).
  • [12] Şeker S. E. Doğal Dil İşleme(Natural Language Processing), Yönetim Bilişim Sistemleri Ansiklopedisi, 4(2), (2015).
  • [13] Khurana D., Koli A., Khatter K., Singh S. Natural Language Processing: State of The Art, Current Trends and Challenges, ArXiv abs/1708.05148 (2017).
  • [14] Adalı E. Doğal Dil İşleme, Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 2(5), (2012).
  • [15] Aliz, 01 Şubat2020, Erişim adresi: https://aliz.ai/natural-language-processing-a-short-introduction-to-get-you-started/
  • [16] Binici K. Kütüphane ve Bilgi Biliminde Tema ve Yönelim, Hiper yayın, s. 41-84, İstanbul, (2018).
  • [17] İlhan U. Application Of K-NN and FPTC Based Text Categorization Algorithms to Turkish News Reports, (2001).
  • [18] GitHup, 20 Eylül 2019, Erişim adresi: https://github.com/ahmetaa/zemberek-nlp
  • [19] WordNet, 03 Şubat 2020, Erişim adresi: https://wordnet.princeton.edu/
  • [20] Uludoğan G., Özçelik R., Parlar S., Ercan G., Yıldız O. T. User Interfaces for Turkish Natural Language Processing, (2019).
  • [21] Eryiğit G. ITU Turkish NLP Web Service, s. 1-4, DOI: 10.3115/v1/E14-2001, (2014).
There are 21 citations in total.

Details

Primary Language Turkish
Subjects Engineering
Journal Section Tasarım ve Teknoloji
Authors

Rabia Kontuk 0000-0002-2132-0973

Metin Turan 0000-0002-1941-6693

Publication Date June 28, 2020
Submission Date February 7, 2020
Published in Issue Year 2020 Volume: 8 Issue: 2

Cite

APA Kontuk, R., & Turan, M. (2020). NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması. Gazi University Journal of Science Part C: Design and Technology, 8(2), 372-382. https://doi.org/10.29109/gujsc.686177

                                TRINDEX     16167        16166    21432    logo.png

      

    e-ISSN:2147-9526