Abstract
Metin üretme çalışmaları, mevcut
cümlelerin analiz edilerek yeni bilgi çıkarımlarının yapıldığı, varolan bir
bilgiden yola çıkarak bununla bağlantılı anlamlı bilgilerin elde edildiği
sistemlerdir. Bu sistemler, özellikle internet üzerinden yapılan aramalarda
girilen cümlelerin türetilerek kullanıcılara arama sonuçları ile ilgili daha
anlamlı sonuçlar döndürebilmek gibi kolaylıklar sağlarlar. Bir metin üretici
geliştirmek için, doğal dilin kaynaklarını tanımlayacak bir dilbilim teorisine
ve bu kaynakları bilgisayar ortamında işleyecek bir yazılım aracına ihtiyaç
vardır. Bu çalışmada, kaynak veri kümesindeki cümlelerden sınıf tabanlı n-gram
modeli kullanılarak Türkçe dil yapısına uygun anlamlı ve yeni cümleler
oluşturulması hedeflenmiştir. Cümle üretimini gerçekleştirmek için trigram
modeli önerilmiş ve bu model kural tabanlı yaklaşım ile birlikte kullanılmak
için geliştirilmiştir. Bu çalışmada kullanılan yöntem ile diğer kullanılan
yöntemlerden farklı olarak, üçlü kelime grupları şeklinde ayrılan gruplardan belirlenen
kurallar çerçevesinde, art arda ekleme yöntemiyle anlamlı ve farklı cümleler
üretilmesi gerçekleştirilmiştir. Böylece kaynak metin dosyasındaki kelime ya da
kelime gruplarından ilişkili olduğu grup sayısı kadar farklı cümleler birbirine
bağlanarak yeni metinler oluşturulmuştur.