Araştırma Makalesi
BibTex RIS Kaynak Göster

EDEBİYAT ARAŞTIRMACILARI İÇİN BİLGİSAYAR DİLLERİ VE METİN MADENCİLİĞİ

Yıl 2024, Cilt: 10 Sayı: 3, 444 - 457, 30.07.2024
https://doi.org/10.20322/littera.1477535

Öz

Bilim, antik Yunanda felsefe demekti. On dokuzuncu yüzyıla gelindiğinde felsefenin çok kapsayıcı olduğu, içinde bulunan edebiyat, tarih, psikoloji gibi sosyal ve beşerî bilimlerin ayrılması ve özerk bir bilim dalları olarak algılanması gerektiği anlaşıldı. Bilgisayar da ilk olarak matematik biliminin bir aracı olarak görüldü. Zamanla teknolojinin var olduğu her alanını kapsayarak büyüdü ve tıpkı felsefenin farklı bilim dallarına ayrılması gibi bilgisayar da farklı bilim dallarına ayrıldı. Şimdi bilgisayarın içinde bulunmadığı hemen hemen hiçbir bilim dalı bulunmamaktadır. Bunlardan biri de Dijital Beşerî Bilimlerdir. Dijital Beşerî Bilimlerin ilgi alanlarından biri edebiyattır. Edebiyatın malzemesi de kelimelerdir. Bir araştırmacının aylarca yapacağı araştırmayı bilgisayar programlama dilleriyle oluşturulan yazılımlar sayesinde kısa sürede yapabilmekte ve verilerini nesnel bir biçimde ortaya koyabilmektedir. Bu çalışmada edebiyat araştırmacıları için metin madenciliğinin temel basamakları anlatılacaktır. Metin madenciliği için oluşturulan araçlardan Stylometry ve The Metrical Tool Hylas edebiyat incelemeleri için model olması nedeniyle araçlar hakkında bilgi verilecektir. Bu araçlar bilgisayar programlama dillerinden Python ve R ile oluşturulmuş ve bilim dünyasına kazandırılmıştır. Bu bağlamda çalışmada bahsedilecek ilk bilgisayar programlama dili R’dır. Diğeri de Python’dur. Çalışmanın son aşamasında metin madenciliğinde dijital araçlarla oluşturulan görselleştirme modellerinden bahsedilecek, görselleştirmeler Latîfî Tezkiresi, Bâkî ve Fuzûlî divanlarından oluşan derlemler aracılığıyla örneklendirilecektir.

Kaynakça

  • Aksan, Doğan (2013). Şiir Dili ve Türk Şiir Dili. Ankara: Bilgi Yayınevi. “An Interdisciplinary Bibliography for Computers and the Humanities Courses”. Computers and the Humanities. 25 (5), 1991, 315–26. https://doi.org/10.1007/BF00120968.
  • Atan, Suat (2020). “Metin Madenciliği: İmkânlar, Yöntemler ve Kısıtlar”. Mehmet Akif Ersoy Üniversitesi SosyalBilimler Enstitüsü Dergisi. (31): 220-39.
  • Bâkî Dîvânı, İstanbul Üniversitesi Nadir Eserler Kütüphanesi T 5571 Numara İle Kayıtlı Bâkî Dîvânı Yazması.
  • Berry, David M., ed. (2012). Understanding Digital Humanities. Houndmills, Basingstoke, Hampshire ; New York: Palgrave Macmillan UK.
  • Brooker, Phillip D. (2019). Programming with Python for Social Scientists. SAGE. https://books.google.com.cy/books?id=Frq9DwAAQBAJ
  • Can, Fazlı (2015). Things Hidden Behind The Numbers of İnce Memeds. http://www.cs.bilkent.edu.tr/~canf/libraryTalk2015.pdf. Bilkent Library Lunchtime Lecture.
  • Can, Fazli; Jon M. Patton (2004). “Change of Writing Style with Time”. Computers and the Humanities. 38 (1): 61-82.
  • Classical Language Toolkit (CLTK) 21.11.2021. Erişim Adresi: http://cltk.org/
  • Çeli̇k, Sadullah. (2020). “Metin Madenciliği ile Shakespeare Külliyatının İncelenmesi”. MANAS Sosyal Araştırmalar Dergisi. 9 (3): 1343-57.
  • Eder, Maciej, Jan Rybicki, ve Mike Kestemont (2016). “Stylometry with R: A Package for Computational Text Analysis”. The R Journal. (8) 1: 107. https://doi.org/10.32614/RJ-2016-007.
  • _____________________________________ (2015). Package ‘stylo’ Functions for a Variety of Stylometric Analyses. https://mran.microsoft.com/snapshot/2015-11-17/web/packages/stylo/stylo.pdf.
  • Fuzulî. (2021). Fuzûlî Dîvânı. hzl. Abdulhakim Kılınç. Ankara: Türkçe Yazma Eserler Kurumu Başkanlığı.
  • Grabar, Darko (2009). “07. 1957-2007: 50 Years of Higher Order Programming Languages”. 33, 1: 72.
  • Laṭīfī. 1575. “Laṭīfī Tezkiresi” Hâlet Efendi Nüshası. Süleymaniye Kütüphanesi, Hâlet Efendi Koleksiyonu, 342 Numaralı Nüsha.
  • Laṭīfī. 1546. “Laṭīfī Tezkiresi” Kayseri Râşid Efendi Nüshası. Kayseri Râşid Efendi Kütüphanesi, Yazma Eserler Bölümü, 1160 Numaralı Nüsha.
  • Mailund, Thomas (2017). Beginning Data Science in R. Berkeley. CA: Apress. https://doi.org/10.1007/978-1-4842-2671-1.
  • Mason, Winter, Jennifer Wortman Vaughan, ve Hanna Wallach (2014). “Computational Social Science and Social Computing”. Machine Learning 95 (3): 257-60. https://doi.org/10.1007/s10994-013-5426-8.
  • Python. 15.11.2021. Erişim Adresi: http://www.python.org/
  • Tarhan, Ayşe (2024), Exploring the Applicability of Digital Humanities Tools to Ottoman and Turkish Languages, Eastern Mediterranean University, Master Thesis of Technology in Information Technology, Gazimağusa, North Cyprus.
  • __________ (2021). Digital Ottoman Projects. Geliş tarihi 19 Ocak 2021, gönderen https://digitalottomanprojects.org/
  • __________ (t.y.). The Latifi Project / Latifi Projesi. Geliş tarihi 19 Ocak 2021, gönderen http://www.thelatifiproject.org/
  • The Metrical Tool Hylas. 15.11.2021. Erişim Adresi: http://206.207.50.59/about
  • Tueller, Michael A (2022). “HYLAS: A new metrical search tool for Greek and Latin poetry”. Copyright\copyright 2022 AIUCD Associazione per l’Informatica Umanistica e la Cultura Digitale.

COMPUTER LANGUAGES AND TEXT MINING FOR LITERARY RESEARCHERS

Yıl 2024, Cilt: 10 Sayı: 3, 444 - 457, 30.07.2024
https://doi.org/10.20322/littera.1477535

Öz

Whereas in Ancient Greece, the study of philosophy included all sciences, by the nineteenth century, many social and human sciences, such as literature, history and psychology, had become to be perceived, not as a part of philosophy, but as separate subjects, distinct from philosophy. Similarly, when computers were first developed, they were seen as a tool of mathematical science. However, over time, computers have become to be considered an integral tool in every field of study and this has brought about the development of separate computer programs for use in distinct subject areas. One such area of study in the field of Digital Humanities, is literature. The material of literature is words and thanks to software created with computer programming languages, research that would otherwise take months can be completed in a very short time and the data can be presented objectively. In this study, the basic steps of text mining for literary researchers will be explained. Information will be given about Stylometry and The Metrical Tool Hylas, as these tools are models for Ottoman literary studies. Since these tools were created with the computer programming languages R and Python, in this study, these two computer programming languages will first be explained. In the second stage of the study, visualisation models created with digital tools in text mining will be examined, and visualisations will be exemplified through corpora consisting of Latîfî Tezkires items, Bâkî, and Fuzûlî divans from Ottoman literature.

Kaynakça

  • Aksan, Doğan (2013). Şiir Dili ve Türk Şiir Dili. Ankara: Bilgi Yayınevi. “An Interdisciplinary Bibliography for Computers and the Humanities Courses”. Computers and the Humanities. 25 (5), 1991, 315–26. https://doi.org/10.1007/BF00120968.
  • Atan, Suat (2020). “Metin Madenciliği: İmkânlar, Yöntemler ve Kısıtlar”. Mehmet Akif Ersoy Üniversitesi SosyalBilimler Enstitüsü Dergisi. (31): 220-39.
  • Bâkî Dîvânı, İstanbul Üniversitesi Nadir Eserler Kütüphanesi T 5571 Numara İle Kayıtlı Bâkî Dîvânı Yazması.
  • Berry, David M., ed. (2012). Understanding Digital Humanities. Houndmills, Basingstoke, Hampshire ; New York: Palgrave Macmillan UK.
  • Brooker, Phillip D. (2019). Programming with Python for Social Scientists. SAGE. https://books.google.com.cy/books?id=Frq9DwAAQBAJ
  • Can, Fazlı (2015). Things Hidden Behind The Numbers of İnce Memeds. http://www.cs.bilkent.edu.tr/~canf/libraryTalk2015.pdf. Bilkent Library Lunchtime Lecture.
  • Can, Fazli; Jon M. Patton (2004). “Change of Writing Style with Time”. Computers and the Humanities. 38 (1): 61-82.
  • Classical Language Toolkit (CLTK) 21.11.2021. Erişim Adresi: http://cltk.org/
  • Çeli̇k, Sadullah. (2020). “Metin Madenciliği ile Shakespeare Külliyatının İncelenmesi”. MANAS Sosyal Araştırmalar Dergisi. 9 (3): 1343-57.
  • Eder, Maciej, Jan Rybicki, ve Mike Kestemont (2016). “Stylometry with R: A Package for Computational Text Analysis”. The R Journal. (8) 1: 107. https://doi.org/10.32614/RJ-2016-007.
  • _____________________________________ (2015). Package ‘stylo’ Functions for a Variety of Stylometric Analyses. https://mran.microsoft.com/snapshot/2015-11-17/web/packages/stylo/stylo.pdf.
  • Fuzulî. (2021). Fuzûlî Dîvânı. hzl. Abdulhakim Kılınç. Ankara: Türkçe Yazma Eserler Kurumu Başkanlığı.
  • Grabar, Darko (2009). “07. 1957-2007: 50 Years of Higher Order Programming Languages”. 33, 1: 72.
  • Laṭīfī. 1575. “Laṭīfī Tezkiresi” Hâlet Efendi Nüshası. Süleymaniye Kütüphanesi, Hâlet Efendi Koleksiyonu, 342 Numaralı Nüsha.
  • Laṭīfī. 1546. “Laṭīfī Tezkiresi” Kayseri Râşid Efendi Nüshası. Kayseri Râşid Efendi Kütüphanesi, Yazma Eserler Bölümü, 1160 Numaralı Nüsha.
  • Mailund, Thomas (2017). Beginning Data Science in R. Berkeley. CA: Apress. https://doi.org/10.1007/978-1-4842-2671-1.
  • Mason, Winter, Jennifer Wortman Vaughan, ve Hanna Wallach (2014). “Computational Social Science and Social Computing”. Machine Learning 95 (3): 257-60. https://doi.org/10.1007/s10994-013-5426-8.
  • Python. 15.11.2021. Erişim Adresi: http://www.python.org/
  • Tarhan, Ayşe (2024), Exploring the Applicability of Digital Humanities Tools to Ottoman and Turkish Languages, Eastern Mediterranean University, Master Thesis of Technology in Information Technology, Gazimağusa, North Cyprus.
  • __________ (2021). Digital Ottoman Projects. Geliş tarihi 19 Ocak 2021, gönderen https://digitalottomanprojects.org/
  • __________ (t.y.). The Latifi Project / Latifi Projesi. Geliş tarihi 19 Ocak 2021, gönderen http://www.thelatifiproject.org/
  • The Metrical Tool Hylas. 15.11.2021. Erişim Adresi: http://206.207.50.59/about
  • Tueller, Michael A (2022). “HYLAS: A new metrical search tool for Greek and Latin poetry”. Copyright\copyright 2022 AIUCD Associazione per l’Informatica Umanistica e la Cultura Digitale.
Toplam 23 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Osmanlı Sahası Klasik Türk Edebiyatı
Bölüm Makaleler
Yazarlar

Ayşe Tarhan 0000-0003-0493-7928

Yayımlanma Tarihi 30 Temmuz 2024
Gönderilme Tarihi 2 Mayıs 2024
Kabul Tarihi 26 Temmuz 2024
Yayımlandığı Sayı Yıl 2024 Cilt: 10 Sayı: 3

Kaynak Göster

APA Tarhan, A. (2024). EDEBİYAT ARAŞTIRMACILARI İÇİN BİLGİSAYAR DİLLERİ VE METİN MADENCİLİĞİ. Littera Turca Journal of Turkish Language and Literature, 10(3), 444-457. https://doi.org/10.20322/littera.1477535
AMA Tarhan A. EDEBİYAT ARAŞTIRMACILARI İÇİN BİLGİSAYAR DİLLERİ VE METİN MADENCİLİĞİ. Littera Turca Journal of Turkish Language and Literature. Temmuz 2024;10(3):444-457. doi:10.20322/littera.1477535
Chicago Tarhan, Ayşe. “EDEBİYAT ARAŞTIRMACILARI İÇİN BİLGİSAYAR DİLLERİ VE METİN MADENCİLİĞİ”. Littera Turca Journal of Turkish Language and Literature 10, sy. 3 (Temmuz 2024): 444-57. https://doi.org/10.20322/littera.1477535.
EndNote Tarhan A (01 Temmuz 2024) EDEBİYAT ARAŞTIRMACILARI İÇİN BİLGİSAYAR DİLLERİ VE METİN MADENCİLİĞİ. Littera Turca Journal of Turkish Language and Literature 10 3 444–457.
IEEE A. Tarhan, “EDEBİYAT ARAŞTIRMACILARI İÇİN BİLGİSAYAR DİLLERİ VE METİN MADENCİLİĞİ”, Littera Turca Journal of Turkish Language and Literature, c. 10, sy. 3, ss. 444–457, 2024, doi: 10.20322/littera.1477535.
ISNAD Tarhan, Ayşe. “EDEBİYAT ARAŞTIRMACILARI İÇİN BİLGİSAYAR DİLLERİ VE METİN MADENCİLİĞİ”. Littera Turca Journal of Turkish Language and Literature 10/3 (Temmuz 2024), 444-457. https://doi.org/10.20322/littera.1477535.
JAMA Tarhan A. EDEBİYAT ARAŞTIRMACILARI İÇİN BİLGİSAYAR DİLLERİ VE METİN MADENCİLİĞİ. Littera Turca Journal of Turkish Language and Literature. 2024;10:444–457.
MLA Tarhan, Ayşe. “EDEBİYAT ARAŞTIRMACILARI İÇİN BİLGİSAYAR DİLLERİ VE METİN MADENCİLİĞİ”. Littera Turca Journal of Turkish Language and Literature, c. 10, sy. 3, 2024, ss. 444-57, doi:10.20322/littera.1477535.
Vancouver Tarhan A. EDEBİYAT ARAŞTIRMACILARI İÇİN BİLGİSAYAR DİLLERİ VE METİN MADENCİLİĞİ. Littera Turca Journal of Turkish Language and Literature. 2024;10(3):444-57.
Makaleler sisteme yüklenmeden önce intihal yazılımı aracılığıyla taranıp intihal raporu ile birlikte sisteme yüklenmelidir. Rapordaki benzerlik indeksinin %20'nin altında olması gerekmektedir.

İlgi, katkı ve desteğiniz için teşekkür eder, iyi çalışmalar dileriz.