Araştırma Makalesi

Anlamlı ve Benzer Olmayan Türkçe Metinler Üretmek için N-Gram Yöntemi ile İstatistiksel ve Kural Tabanlı Yaklaşımın Birlikte Kullanımı

Cilt: 22 Sayı: 65 15 Mayıs 2020
PDF İndir
EN TR

Anlamlı ve Benzer Olmayan Türkçe Metinler Üretmek için N-Gram Yöntemi ile İstatistiksel ve Kural Tabanlı Yaklaşımın Birlikte Kullanımı

Öz

Metin üretme çalışmaları, mevcut cümlelerin analiz edilerek yeni bilgi çıkarımlarının yapıldığı, varolan bir bilgiden yola çıkarak bununla bağlantılı anlamlı bilgilerin elde edildiği sistemlerdir. Bu sistemler, özellikle internet üzerinden yapılan aramalarda girilen cümlelerin türetilerek kullanıcılara arama sonuçları ile ilgili daha anlamlı sonuçlar döndürebilmek gibi kolaylıklar sağlarlar. Bir metin üretici geliştirmek için, doğal dilin kaynaklarını tanımlayacak bir dilbilim teorisine ve bu kaynakları bilgisayar ortamında işleyecek bir yazılım aracına ihtiyaç vardır. Bu çalışmada, kaynak veri kümesindeki cümlelerden sınıf tabanlı n-gram modeli kullanılarak Türkçe dil yapısına uygun anlamlı ve yeni cümleler oluşturulması hedeflenmiştir. Cümle üretimini gerçekleştirmek için trigram modeli önerilmiş ve bu model kural tabanlı yaklaşım ile birlikte kullanılmak için geliştirilmiştir. Bu çalışmada kullanılan yöntem ile diğer kullanılan yöntemlerden farklı olarak, üçlü kelime grupları şeklinde ayrılan gruplardan belirlenen kurallar çerçevesinde, art arda ekleme yöntemiyle anlamlı ve farklı cümleler üretilmesi gerçekleştirilmiştir. Böylece kaynak metin dosyasındaki kelime ya da kelime gruplarından ilişkili olduğu grup sayısı kadar farklı cümleler birbirine bağlanarak yeni metinler oluşturulmuştur. 

Anahtar Kelimeler

Kaynakça

  1. [1] Akalın, Ş.H. 2007. Türk Dünyasında Bilgisayar Destekli Dil Bilimi Çalışmaları ve Türk Dil Kurumu. 38. Uluslararası Asya ve Kuzey Afrika Çalışmaları Kongresi (ICANAS), 10-15 Eylül, Ankara, 17-22.
  2. [2] Oflazer, K. ve Bozşahin, H.C. 2006. Türkçe Doğal Dil İşleme. Çukurova Üniversitesi Türkoloji Araştırmaları Merkezi.
  3. [3] Korkmaz, T. 1996. Turkish Text Generation with Systemic-Functional Grammar. Master's Thesis, Bilkent University, Department of Computer Engineering and Information Science, Ankara.
  4. [4] Gündoğdu, Ö.E. ve Duru, N. 2016. Türkçe Metin Özetlemede Kullanılan Yöntemler. 18. Akademik Bilişim Konferansı, Adnan Menderes Üniversitesi, 30 Ocak-5 Şubat, Aydın.
  5. [5] Kazkılınç, S. 2013. Türkçe Metinlerin Etiketlenmesi. Yüksek Lisans Tezi, İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, İstanbul.
  6. [6] Mocan, Z. 2005. Metin İşleme:Soru Soran Bir Sistem Tasarımı. Yüksek Lisans Tezi, İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, İstanbul.
  7. [7] Bilgin, M. ve Amasyalı, M.F. 2017. Dependency parsing with stacked conditional random fields for Turkish. Journal of the Faculty of Engineering and Architecture of Gazi University, 32(2), 385-392.
  8. [8] Adalı, Ş. ve Erenler, Y. 2003. Türkçe için Okuma Fonksiyonlu Otomatik Metin Oluşturma Sistemi. Elektrik-Elektronik-Bilgisayar Mühendisliği 10. Ulusal Kongresi, İstanbul Sayfa:484-487.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Mühendislik

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

15 Mayıs 2020

Gönderilme Tarihi

30 Mart 2019

Kabul Tarihi

9 Mart 2020

Yayımlandığı Sayı

Yıl 2020 Cilt: 22 Sayı: 65

Kaynak Göster

APA
Şirin, Y., & Kutlugün, M. A. (2020). Anlamlı ve Benzer Olmayan Türkçe Metinler Üretmek için N-Gram Yöntemi ile İstatistiksel ve Kural Tabanlı Yaklaşımın Birlikte Kullanımı. Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi, 22(65), 331-342. https://doi.org/10.21205/deufmd.2020226504
AMA
1.Şirin Y, Kutlugün MA. Anlamlı ve Benzer Olmayan Türkçe Metinler Üretmek için N-Gram Yöntemi ile İstatistiksel ve Kural Tabanlı Yaklaşımın Birlikte Kullanımı. DEUFMD. 2020;22(65):331-342. doi:10.21205/deufmd.2020226504
Chicago
Şirin, Yahya, ve Mehmet Ali Kutlugün. 2020. “Anlamlı ve Benzer Olmayan Türkçe Metinler Üretmek için N-Gram Yöntemi ile İstatistiksel ve Kural Tabanlı Yaklaşımın Birlikte Kullanımı”. Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi 22 (65): 331-42. https://doi.org/10.21205/deufmd.2020226504.
EndNote
Şirin Y, Kutlugün MA (01 Mayıs 2020) Anlamlı ve Benzer Olmayan Türkçe Metinler Üretmek için N-Gram Yöntemi ile İstatistiksel ve Kural Tabanlı Yaklaşımın Birlikte Kullanımı. Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi 22 65 331–342.
IEEE
[1]Y. Şirin ve M. A. Kutlugün, “Anlamlı ve Benzer Olmayan Türkçe Metinler Üretmek için N-Gram Yöntemi ile İstatistiksel ve Kural Tabanlı Yaklaşımın Birlikte Kullanımı”, DEUFMD, c. 22, sy 65, ss. 331–342, May. 2020, doi: 10.21205/deufmd.2020226504.
ISNAD
Şirin, Yahya - Kutlugün, Mehmet Ali. “Anlamlı ve Benzer Olmayan Türkçe Metinler Üretmek için N-Gram Yöntemi ile İstatistiksel ve Kural Tabanlı Yaklaşımın Birlikte Kullanımı”. Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi 22/65 (01 Mayıs 2020): 331-342. https://doi.org/10.21205/deufmd.2020226504.
JAMA
1.Şirin Y, Kutlugün MA. Anlamlı ve Benzer Olmayan Türkçe Metinler Üretmek için N-Gram Yöntemi ile İstatistiksel ve Kural Tabanlı Yaklaşımın Birlikte Kullanımı. DEUFMD. 2020;22:331–342.
MLA
Şirin, Yahya, ve Mehmet Ali Kutlugün. “Anlamlı ve Benzer Olmayan Türkçe Metinler Üretmek için N-Gram Yöntemi ile İstatistiksel ve Kural Tabanlı Yaklaşımın Birlikte Kullanımı”. Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi, c. 22, sy 65, Mayıs 2020, ss. 331-42, doi:10.21205/deufmd.2020226504.
Vancouver
1.Yahya Şirin, Mehmet Ali Kutlugün. Anlamlı ve Benzer Olmayan Türkçe Metinler Üretmek için N-Gram Yöntemi ile İstatistiksel ve Kural Tabanlı Yaklaşımın Birlikte Kullanımı. DEUFMD. 01 Mayıs 2020;22(65):331-42. doi:10.21205/deufmd.2020226504

Bu dergi, Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı (CC BY-NC 4.0) altında lisanslanmıştır.

download?token=eyJhdXRoX3JvbGVzIjpbXSwiZW5kcG9pbnQiOiJmaWxlIiwicGF0aCI6IjliNTAvMDBjMi8xZmIxLzY5MjZmZDIyOGE1NzgyLjA3MzU5MTk2LnBuZyIsImV4cCI6MTc2NDE2OTE1Nywibm9uY2UiOiJhZDRmNjNlNzdhOWYwOWQ4YTNjNGVmNGIxOTFlZWViNyJ9.4Dxgc9mc-p4Tyti8NTU5pxEfGUWeuJud1fPWxu2mUy8