EN
TR
Anlamlı ve Benzer Olmayan Türkçe Metinler Üretmek için N-Gram Yöntemi ile İstatistiksel ve Kural Tabanlı Yaklaşımın Birlikte Kullanımı
Abstract
Metin üretme çalışmaları, mevcut
cümlelerin analiz edilerek yeni bilgi çıkarımlarının yapıldığı, varolan bir
bilgiden yola çıkarak bununla bağlantılı anlamlı bilgilerin elde edildiği
sistemlerdir. Bu sistemler, özellikle internet üzerinden yapılan aramalarda
girilen cümlelerin türetilerek kullanıcılara arama sonuçları ile ilgili daha
anlamlı sonuçlar döndürebilmek gibi kolaylıklar sağlarlar. Bir metin üretici
geliştirmek için, doğal dilin kaynaklarını tanımlayacak bir dilbilim teorisine
ve bu kaynakları bilgisayar ortamında işleyecek bir yazılım aracına ihtiyaç
vardır. Bu çalışmada, kaynak veri kümesindeki cümlelerden sınıf tabanlı n-gram
modeli kullanılarak Türkçe dil yapısına uygun anlamlı ve yeni cümleler
oluşturulması hedeflenmiştir. Cümle üretimini gerçekleştirmek için trigram
modeli önerilmiş ve bu model kural tabanlı yaklaşım ile birlikte kullanılmak
için geliştirilmiştir. Bu çalışmada kullanılan yöntem ile diğer kullanılan
yöntemlerden farklı olarak, üçlü kelime grupları şeklinde ayrılan gruplardan belirlenen
kurallar çerçevesinde, art arda ekleme yöntemiyle anlamlı ve farklı cümleler
üretilmesi gerçekleştirilmiştir. Böylece kaynak metin dosyasındaki kelime ya da
kelime gruplarından ilişkili olduğu grup sayısı kadar farklı cümleler birbirine
bağlanarak yeni metinler oluşturulmuştur.
Keywords
References
- [1] Akalın, Ş.H. 2007. Türk Dünyasında Bilgisayar Destekli Dil Bilimi Çalışmaları ve Türk Dil Kurumu. 38. Uluslararası Asya ve Kuzey Afrika Çalışmaları Kongresi (ICANAS), 10-15 Eylül, Ankara, 17-22.
- [2] Oflazer, K. ve Bozşahin, H.C. 2006. Türkçe Doğal Dil İşleme. Çukurova Üniversitesi Türkoloji Araştırmaları Merkezi.
- [3] Korkmaz, T. 1996. Turkish Text Generation with Systemic-Functional Grammar. Master's Thesis, Bilkent University, Department of Computer Engineering and Information Science, Ankara.
- [4] Gündoğdu, Ö.E. ve Duru, N. 2016. Türkçe Metin Özetlemede Kullanılan Yöntemler. 18. Akademik Bilişim Konferansı, Adnan Menderes Üniversitesi, 30 Ocak-5 Şubat, Aydın.
- [5] Kazkılınç, S. 2013. Türkçe Metinlerin Etiketlenmesi. Yüksek Lisans Tezi, İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, İstanbul.
- [6] Mocan, Z. 2005. Metin İşleme:Soru Soran Bir Sistem Tasarımı. Yüksek Lisans Tezi, İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, İstanbul.
- [7] Bilgin, M. ve Amasyalı, M.F. 2017. Dependency parsing with stacked conditional random fields for Turkish. Journal of the Faculty of Engineering and Architecture of Gazi University, 32(2), 385-392.
- [8] Adalı, Ş. ve Erenler, Y. 2003. Türkçe için Okuma Fonksiyonlu Otomatik Metin Oluşturma Sistemi. Elektrik-Elektronik-Bilgisayar Mühendisliği 10. Ulusal Kongresi, İstanbul Sayfa:484-487.
Details
Primary Language
Turkish
Subjects
Engineering
Journal Section
Research Article
Publication Date
May 15, 2020
Submission Date
March 30, 2019
Acceptance Date
March 9, 2020
Published in Issue
Year 2020 Volume: 22 Number: 65
APA
Şirin, Y., & Kutlugün, M. A. (2020). Anlamlı ve Benzer Olmayan Türkçe Metinler Üretmek için N-Gram Yöntemi ile İstatistiksel ve Kural Tabanlı Yaklaşımın Birlikte Kullanımı. Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen Ve Mühendislik Dergisi, 22(65), 331-342. https://doi.org/10.21205/deufmd.2020226504
AMA
1.Şirin Y, Kutlugün MA. Anlamlı ve Benzer Olmayan Türkçe Metinler Üretmek için N-Gram Yöntemi ile İstatistiksel ve Kural Tabanlı Yaklaşımın Birlikte Kullanımı. DEUFMD. 2020;22(65):331-342. doi:10.21205/deufmd.2020226504
Chicago
Şirin, Yahya, and Mehmet Ali Kutlugün. 2020. “Anlamlı Ve Benzer Olmayan Türkçe Metinler Üretmek Için N-Gram Yöntemi Ile İstatistiksel Ve Kural Tabanlı Yaklaşımın Birlikte Kullanımı”. Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen Ve Mühendislik Dergisi 22 (65): 331-42. https://doi.org/10.21205/deufmd.2020226504.
EndNote
Şirin Y, Kutlugün MA (May 1, 2020) Anlamlı ve Benzer Olmayan Türkçe Metinler Üretmek için N-Gram Yöntemi ile İstatistiksel ve Kural Tabanlı Yaklaşımın Birlikte Kullanımı. Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi 22 65 331–342.
IEEE
[1]Y. Şirin and M. A. Kutlugün, “Anlamlı ve Benzer Olmayan Türkçe Metinler Üretmek için N-Gram Yöntemi ile İstatistiksel ve Kural Tabanlı Yaklaşımın Birlikte Kullanımı”, DEUFMD, vol. 22, no. 65, pp. 331–342, May 2020, doi: 10.21205/deufmd.2020226504.
ISNAD
Şirin, Yahya - Kutlugün, Mehmet Ali. “Anlamlı Ve Benzer Olmayan Türkçe Metinler Üretmek Için N-Gram Yöntemi Ile İstatistiksel Ve Kural Tabanlı Yaklaşımın Birlikte Kullanımı”. Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi 22/65 (May 1, 2020): 331-342. https://doi.org/10.21205/deufmd.2020226504.
JAMA
1.Şirin Y, Kutlugün MA. Anlamlı ve Benzer Olmayan Türkçe Metinler Üretmek için N-Gram Yöntemi ile İstatistiksel ve Kural Tabanlı Yaklaşımın Birlikte Kullanımı. DEUFMD. 2020;22:331–342.
MLA
Şirin, Yahya, and Mehmet Ali Kutlugün. “Anlamlı Ve Benzer Olmayan Türkçe Metinler Üretmek Için N-Gram Yöntemi Ile İstatistiksel Ve Kural Tabanlı Yaklaşımın Birlikte Kullanımı”. Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen Ve Mühendislik Dergisi, vol. 22, no. 65, May 2020, pp. 331-42, doi:10.21205/deufmd.2020226504.
Vancouver
1.Yahya Şirin, Mehmet Ali Kutlugün. Anlamlı ve Benzer Olmayan Türkçe Metinler Üretmek için N-Gram Yöntemi ile İstatistiksel ve Kural Tabanlı Yaklaşımın Birlikte Kullanımı. DEUFMD. 2020 May 1;22(65):331-42. doi:10.21205/deufmd.2020226504