Research Article
BibTex RIS Cite

Büyük Dil Modelleri ile Tarihî Metinlerde Adlandırılmış Varlık Tanıma: Evliya Çelebi Seyahatnamesi'nden Botanik Bilgi Çıkarımı

Year 2026, Volume: 28 Issue: 1, 259 - 267, 25.03.2026
https://doi.org/10.32709/akusosbil.1843063
https://izlik.org/JA36TE44CC

Abstract

Bu çalışmada, 17. yüzyıl Osmanlı seyahat edebiyatının en önemli eserlerinden biri olan Evliya Çelebi Seyahatnamesi'nden bitki isimlerinin otomatik olarak çıkarılması için büyük dil modeli (BDM) tabanlı bir adlandırılmış varlık tanıma (AVT) sistemi geliştirilmiştir. Geliştirilen sistem, Claude Sonnet 4.5 modeli kullanarak tarihî metinleri işlemektedir. Seyahatname'nin on cildi analiz edilmiş ve bitki türü adları tespit edilmiştir. Sistem, Osmanlı Türkçesi'ndeki Arapça ve Farsça kökenli botanik terimleri (engür→üzüm, sanavber→çam, gendüm→buğday) başarıyla tanımış ve modern karşılıklarıyla eşleştirmiştir. Çalışmanın sonuçları, BDM'lerin tarihî veriler üzerinde bitki isimlerinin etiketlenmesi görevinde etkili bir şekilde kullanılabileceğini göstermektedir. Elde edilen veri seti, Osmanlı dönemi botanik coğrafyası sözlüğü ve dijital beşeri bilimler araştırmaları için değerli bir kaynak oluşturmaktadır.

References

  • Bakır, M. (2022). Evliya Çelebi Seyahatnamesi'nde organ adları (Yayımlanmamış yüksek lisans tezi). Kocaeli Üniversitesi, Kocaeli.
  • Brown, T. B., Mann, B., Ryder, N., Subbiah, M., Kaplan, J., Dhariwal, P., ... ve Amodei, D. (2020). Language models are few-shot learners. Advances in Neural Information Processing Systems, 33, 1877-1901.
  • Can, F., Kocberber, S., Balcik, E., Kaynak, C., Ocalan, H. C. ve Vursavas, O. M. (2008). Information retrieval on Turkish texts. Journal of the American Society for Information Science and Technology, 59(3), 407-421. Dankoff, R. (2004). An Ottoman mentality: The world of Evliya Çelebi. Brill. Dankoff, R. (2006). Evliya Çelebi Seyahatnamesi okuma sözlüğü. Yapı Kredi Yayınları.
  • Ehrmann, M., Colavizza, G., Rochat, Y. ve Kaplan, F. (2016). Diachronic evaluation of NER systems on old newspapers. Proceedings of the 13th Conference on Natural Language Processing (KONVENS), 97-107.
  • Evliya Çelebi b. Derviş Mehemmed Zıllî. (2007). Evliya Çelebi Seyahatnamesi (Cilt 1-10) (R. Dankoff, S. A. Kahraman ve Y. Dağlı, Haz.). Yapı Kredi Yayınları.
  • Karacaoğlan, Ç. (2018). Evliya Çelebi'nin Seyahatname'sinde yer alan bitki adları (Yayımlanmamış yüksek lisans tezi). Hacettepe Üniversitesi, Ankara.
  • Kartal, A. (2016). Evliya Çelebi Seyahatnâmesi'nde geçen yiyecek adları üzerine bir dil incelemesi (Yayımlanmamış yüksek lisans tezi). Erciyes Üniversitesi, Kayseri.
  • Kırmıt, D. (2025). Evliya Çelebi Seyahatnamesi'nde meslek adları (Yayımlanmamış doktora tezi). Ankara Yıldırım Beyazıt Üniversitesi, Ankara.
  • Küçük Ak, F. (2023). Evliyâ Çelebi Seyahatnâmesi'nde mimari ve mimari süsleme terimleri (Yayımlanmamış doktora tezi). Ankara Üniversitesi, Ankara.
  • Li, J., Sun, A., Han, J. ve Li, C. (2023). A survey on deep learning for named entity recognition. IEEE Transactions on Knowledge and Data Engineering, 34(1), 50-70.
  • Öz, S. (2007). Evliya Çelebi Seyahatnamesi'ne göre Anadolu'da yer adları (Yayımlanmamış yüksek lisans tezi). Kırıkkale Üniversitesi, Kırıkkale.
  • Peker, S. D. (2015). Evliya Çelebi Seyahatnamesi'nde hayvanlarla ilgili söz varlığı (Yayımlanmamış yüksek lisans tezi). Gazi Üniversitesi, Ankara. Piotrowski, M. (2012). Natural language processing for historical texts. Morgan & Claypool.
  • Sağ Yener, Z. (2024). Evliya Çelebi'nin Seyahatnamesi'nde kavramsal metaforlar (Yayımlanmamış doktora tezi). Fatih Sultan Mehmet Vakıf Üniversitesi, İstanbul.
  • Şeker, G. A. ve Eryiğit, G. (2012). Initial explorations on using CRFs for Turkish named entity recognition. Proceedings of COLING 2012, 2459-2474.
  • Wang, S., Sun, X., Li, X., Ouyang, R., Wu, F., Zhang, T., ... ve Wang, H. (2023). GPT-NER: Named entity recognition via large language models. arXiv preprint arXiv:2304.10428.
  • Wei, J., Tay, Y., Bommasani, R., Raffel, C., Zoph, B., Borgeaud, S., ... ve Fedus, W. (2022). Emergent abilities of large language models. Transactions on Machine Learning Research.
  • Yeniterzi, R. (2011). Exploiting morphology in Turkish named entity recognition system. Proceedings of the ACL 2011 Student Session, 105-110.

Identifying Named Entities in Historical Texts with Major Language Models: Extracting Botanical Information from Evliya Çelebi's Seyahatname (Travelogue)

Year 2026, Volume: 28 Issue: 1, 259 - 267, 25.03.2026
https://doi.org/10.32709/akusosbil.1843063
https://izlik.org/JA36TE44CC

Abstract

This study develops a Large Language Model (LLM)-based Named Entity Recognition (NER) system for the automatic extraction of plant names from Evliya Çelebi's Seyahatname, one of the most significant works of seventeenth-century Ottoman travel literature. The system processes historical texts using the Claude Sonnet 4.5 model. All ten volumes of the Seyahatname were analyzed, and plant species names were identified throughout the corpus. The system successfully recognized botanical terms of Arabic and Persian origin in Ottoman Turkish (e.g., engür→grape, sanavber→pine, gendüm→wheat) and mapped them to their modern equivalents. The findings demonstrate that LLMs can be effectively employed for plant name annotation tasks in historical texts. The resulting dataset constitutes a valuable resource for Ottoman-period botanical geography, lexicography, and digital humanities research.

References

  • Bakır, M. (2022). Evliya Çelebi Seyahatnamesi'nde organ adları (Yayımlanmamış yüksek lisans tezi). Kocaeli Üniversitesi, Kocaeli.
  • Brown, T. B., Mann, B., Ryder, N., Subbiah, M., Kaplan, J., Dhariwal, P., ... ve Amodei, D. (2020). Language models are few-shot learners. Advances in Neural Information Processing Systems, 33, 1877-1901.
  • Can, F., Kocberber, S., Balcik, E., Kaynak, C., Ocalan, H. C. ve Vursavas, O. M. (2008). Information retrieval on Turkish texts. Journal of the American Society for Information Science and Technology, 59(3), 407-421. Dankoff, R. (2004). An Ottoman mentality: The world of Evliya Çelebi. Brill. Dankoff, R. (2006). Evliya Çelebi Seyahatnamesi okuma sözlüğü. Yapı Kredi Yayınları.
  • Ehrmann, M., Colavizza, G., Rochat, Y. ve Kaplan, F. (2016). Diachronic evaluation of NER systems on old newspapers. Proceedings of the 13th Conference on Natural Language Processing (KONVENS), 97-107.
  • Evliya Çelebi b. Derviş Mehemmed Zıllî. (2007). Evliya Çelebi Seyahatnamesi (Cilt 1-10) (R. Dankoff, S. A. Kahraman ve Y. Dağlı, Haz.). Yapı Kredi Yayınları.
  • Karacaoğlan, Ç. (2018). Evliya Çelebi'nin Seyahatname'sinde yer alan bitki adları (Yayımlanmamış yüksek lisans tezi). Hacettepe Üniversitesi, Ankara.
  • Kartal, A. (2016). Evliya Çelebi Seyahatnâmesi'nde geçen yiyecek adları üzerine bir dil incelemesi (Yayımlanmamış yüksek lisans tezi). Erciyes Üniversitesi, Kayseri.
  • Kırmıt, D. (2025). Evliya Çelebi Seyahatnamesi'nde meslek adları (Yayımlanmamış doktora tezi). Ankara Yıldırım Beyazıt Üniversitesi, Ankara.
  • Küçük Ak, F. (2023). Evliyâ Çelebi Seyahatnâmesi'nde mimari ve mimari süsleme terimleri (Yayımlanmamış doktora tezi). Ankara Üniversitesi, Ankara.
  • Li, J., Sun, A., Han, J. ve Li, C. (2023). A survey on deep learning for named entity recognition. IEEE Transactions on Knowledge and Data Engineering, 34(1), 50-70.
  • Öz, S. (2007). Evliya Çelebi Seyahatnamesi'ne göre Anadolu'da yer adları (Yayımlanmamış yüksek lisans tezi). Kırıkkale Üniversitesi, Kırıkkale.
  • Peker, S. D. (2015). Evliya Çelebi Seyahatnamesi'nde hayvanlarla ilgili söz varlığı (Yayımlanmamış yüksek lisans tezi). Gazi Üniversitesi, Ankara. Piotrowski, M. (2012). Natural language processing for historical texts. Morgan & Claypool.
  • Sağ Yener, Z. (2024). Evliya Çelebi'nin Seyahatnamesi'nde kavramsal metaforlar (Yayımlanmamış doktora tezi). Fatih Sultan Mehmet Vakıf Üniversitesi, İstanbul.
  • Şeker, G. A. ve Eryiğit, G. (2012). Initial explorations on using CRFs for Turkish named entity recognition. Proceedings of COLING 2012, 2459-2474.
  • Wang, S., Sun, X., Li, X., Ouyang, R., Wu, F., Zhang, T., ... ve Wang, H. (2023). GPT-NER: Named entity recognition via large language models. arXiv preprint arXiv:2304.10428.
  • Wei, J., Tay, Y., Bommasani, R., Raffel, C., Zoph, B., Borgeaud, S., ... ve Fedus, W. (2022). Emergent abilities of large language models. Transactions on Machine Learning Research.
  • Yeniterzi, R. (2011). Exploiting morphology in Turkish named entity recognition system. Proceedings of the ACL 2011 Student Session, 105-110.
There are 17 citations in total.

Details

Primary Language Turkish
Subjects Linguistics (Other)
Journal Section Research Article
Authors

Gönül Erdem Nas 0000-0001-8100-3884

Submission Date December 16, 2025
Acceptance Date March 7, 2026
Publication Date March 25, 2026
DOI https://doi.org/10.32709/akusosbil.1843063
IZ https://izlik.org/JA36TE44CC
Published in Issue Year 2026 Volume: 28 Issue: 1

Cite

APA Erdem Nas, G. (2026). Büyük Dil Modelleri ile Tarihî Metinlerde Adlandırılmış Varlık Tanıma: Evliya Çelebi Seyahatnamesi’nden Botanik Bilgi Çıkarımı. Afyon Kocatepe Üniversitesi Sosyal Bilimler Dergisi, 28(1), 259-267. https://doi.org/10.32709/akusosbil.1843063