OTOMATİK METİN ÖZETLEME İÇİN GENETİK ALGORİTMA TABANLI CÜMLE ÇIKARIMI
Öz
İnternetin gelişmesiyle beraber dijital ortamda bulunan veri miktarı
sürekli artış göstermektedir. Özellikle web 2.0 teknolojisiyle birlikte
wikipedia, blog, sosyal medya gibi, kullanıcıların yeni içerik ekleyebildiği
sitelerin artması sonucunda internet ortamındaki bilgi miktarının hem sayısı
hem de büyüklüğü sürekli artarak devasa boyutlara ulaşmıştır. Verilerin bu
kadar çok olduğu bir ortamda istenilen bilgiye ulaşmak ciddi bir
problemdir. Günümüz bilgi çağı, aranan
bilgiye daha çabuk ve hızlı erişmek için otomatik metin özetleme sitemlerinin
bilgi çıkarımı ile ilgili birçok alanda kullanımını zorunlu hale
getirmektedir. Bu çalışmada cümle
çıkarımına dayalı metin özetleme yöntemleri ele alınmış, ilk olarak doküman
içerisinde yer alan cümleleri temsil edecek öznitelikler çıkarılmış, ardından bu
özniteliklerin özet
oluşturmadaki etkinliği genetik algoritma yardımıyla belirlenmeye
çalışılmıştır. Çalışmada kullanılan veri
seti Türkçe haber metinleri ve bunların özetlerini içeren 120 dokumandan
oluşmaktadır. 80 adet dokuman genetik
algoritma yardımıyla eğitilerek,
özniteliklere ilişkin en iyi ağırlık değerleri belirlenmiş, daha sonra
bu ağırlıklar yardımıyla 40 adet test dokümanı özetlenmiş ve sonuçlar orijinal
özetlerle karşılaştırılmıştır.
Anahtar Kelimeler
Kaynakça
- Babar, S. A., & Patil, P. D. (2015). Improving Performance of Text Summarization. Procedia Computer Science, 46, 354-363.
- Binwahlan, M. S., Salim, N., & Suanmali, L. (2009, April). Swarm based text summarization. In Computer Science and Information Technology-Spring Conference, 2009. IACSITSC'09. International Association of (pp. 145-150). IEEE.
- Brandow, R., Mitze, K., & Rau, L. F. (1995). Automatic condensation of electronic publications by sentence selection. Information Processing & Management, 31(5), 675-685.
- Cigir, C., Kutlu, M., & Cicekli, I. (2009, September). Generic text summarization for Turkish. In Computer and Information Sciences, 2009. ISCIS 2009. 24th International Symposium on (pp. 224-229). IEEE.
- Dalal, V., & Malik, L. G. (2013, December). A survey of extractive and abstractive text summarization techniques. In Emerging Trends in Engineering and Technology (ICETET), 2013 6th International Conference on (pp. 109-110). IEEE. Document understanding conferences (DUC) < http://www-nlpir.nist.gov/projects/duc/index.html >
- Edmondson, H. P. (1969). New Methods in Automatic Extraction. Journal of the Association for Computing Machinery, vol. 16, no. 2, pp. 264–285, 1969.
- Edmundson, H. P., & Wyllys, R. E. (1961). Automatic abstracting and indexing—survey and recommendations. Communications of the ACM, 4(5), 226-234.
- Fattah, M. A., & Ren, F. (2008). Automatic text summarization. Gas, 692, 10785. Gholamrezazadeh, S., Salehi, M. A., & Gholamzadeh, B. (2009). A comprehensive survey on text summarization systems. Proceedings of CSA, 9, 1-6.
Ayrıntılar
Birincil Dil
Türkçe
Konular
-
Bölüm
Araştırma Makalesi
Yayımlanma Tarihi
20 Aralık 2017
Gönderilme Tarihi
16 Kasım 2017
Kabul Tarihi
23 Kasım 2017
Yayımlandığı Sayı
Yıl 2017 Cilt: 3 Sayı: 2