OTOMATİK METİN ÖZETLEME İÇİN GENETİK ALGORİTMA TABANLI CÜMLE ÇIKARIMI
Abstract
İnternetin gelişmesiyle beraber dijital ortamda bulunan veri miktarı
sürekli artış göstermektedir. Özellikle web 2.0 teknolojisiyle birlikte
wikipedia, blog, sosyal medya gibi, kullanıcıların yeni içerik ekleyebildiği
sitelerin artması sonucunda internet ortamındaki bilgi miktarının hem sayısı
hem de büyüklüğü sürekli artarak devasa boyutlara ulaşmıştır. Verilerin bu
kadar çok olduğu bir ortamda istenilen bilgiye ulaşmak ciddi bir
problemdir. Günümüz bilgi çağı, aranan
bilgiye daha çabuk ve hızlı erişmek için otomatik metin özetleme sitemlerinin
bilgi çıkarımı ile ilgili birçok alanda kullanımını zorunlu hale
getirmektedir. Bu çalışmada cümle
çıkarımına dayalı metin özetleme yöntemleri ele alınmış, ilk olarak doküman
içerisinde yer alan cümleleri temsil edecek öznitelikler çıkarılmış, ardından bu
özniteliklerin özet
oluşturmadaki etkinliği genetik algoritma yardımıyla belirlenmeye
çalışılmıştır. Çalışmada kullanılan veri
seti Türkçe haber metinleri ve bunların özetlerini içeren 120 dokumandan
oluşmaktadır. 80 adet dokuman genetik
algoritma yardımıyla eğitilerek,
özniteliklere ilişkin en iyi ağırlık değerleri belirlenmiş, daha sonra
bu ağırlıklar yardımıyla 40 adet test dokümanı özetlenmiş ve sonuçlar orijinal
özetlerle karşılaştırılmıştır.
Keywords
References
- Babar, S. A., & Patil, P. D. (2015). Improving Performance of Text Summarization. Procedia Computer Science, 46, 354-363.
- Binwahlan, M. S., Salim, N., & Suanmali, L. (2009, April). Swarm based text summarization. In Computer Science and Information Technology-Spring Conference, 2009. IACSITSC'09. International Association of (pp. 145-150). IEEE.
- Brandow, R., Mitze, K., & Rau, L. F. (1995). Automatic condensation of electronic publications by sentence selection. Information Processing & Management, 31(5), 675-685.
- Cigir, C., Kutlu, M., & Cicekli, I. (2009, September). Generic text summarization for Turkish. In Computer and Information Sciences, 2009. ISCIS 2009. 24th International Symposium on (pp. 224-229). IEEE.
- Dalal, V., & Malik, L. G. (2013, December). A survey of extractive and abstractive text summarization techniques. In Emerging Trends in Engineering and Technology (ICETET), 2013 6th International Conference on (pp. 109-110). IEEE. Document understanding conferences (DUC) < http://www-nlpir.nist.gov/projects/duc/index.html >
- Edmondson, H. P. (1969). New Methods in Automatic Extraction. Journal of the Association for Computing Machinery, vol. 16, no. 2, pp. 264–285, 1969.
- Edmundson, H. P., & Wyllys, R. E. (1961). Automatic abstracting and indexing—survey and recommendations. Communications of the ACM, 4(5), 226-234.
- Fattah, M. A., & Ren, F. (2008). Automatic text summarization. Gas, 692, 10785. Gholamrezazadeh, S., Salehi, M. A., & Gholamzadeh, B. (2009). A comprehensive survey on text summarization systems. Proceedings of CSA, 9, 1-6.
Details
Primary Language
Turkish
Subjects
-
Journal Section
Research Article
Publication Date
December 20, 2017
Submission Date
November 16, 2017
Acceptance Date
November 23, 2017
Published in Issue
Year 2017 Volume: 3 Number: 2