Research Article

Paragraf Tabanlı Çıkarımsal Özetlemede Öbekleme Kullanan İki Yeni Yöntemin Kıyaslanması

Volume: 6 Number: 4 August 1, 2018
TR EN

Paragraf Tabanlı Çıkarımsal Özetlemede Öbekleme Kullanan İki Yeni Yöntemin Kıyaslanması

Abstract

Özetleme, bir bakıma metinleri kısaltma işlemidir. Bu kısaltma işlemi metinlerdeki önemli bilgileri içerecek şekilde olmalıdır. Bu çalışmanın amacı da İngilizce dilinde yazılmış makale, haber vs. gibi doküman paragraflarının içerdiği bilgi önemine göre seçilerek özetleme yapılmasıdır. Çalışmanın ilk aşamasında doküman kümesini temsil edecek önemli kelimeler belirlenmiştir. Bu aşamada tüm dokümanlarda geçen kelimeler kök geçiş sıklıklarına göre büyükten küçüğe göre sıralanır ve belirli sayıda seçilen en sık kelimeler ile paragraf vektörü temsil edilir. Bir sonraki aşamada, istenilen özet oranına göre paragraflar kümelere ayrıştırılır. Kümeleme algoritması olarak K-Means kullanılmıştır. Kümeler oluşturulurken başlangıç noktalarının belirlenmesi amacıyla iki farklı yöntem kullanılmıştır. İlk yöntemde, geçiş sıklıkları en yüksek ilk 10 kelimeden birinin en fazla görüldüğü paragraflar küme başlangıçları olarak seçilir. İkinci yöntemde, kullanıcının belirlediği özet oranına göre seçilecek anahtar kelime sayısı belirlenir. Daha sonra bu anahtar kelimelerin en çok geçtiği paragraflar başlangıç noktaları olarak belirlenir. Özet oluşturmada çıkarım yöntemi olarak, ayrıştırılan her bir küme içinden kümenin merkez noktasına Jaccard uzaklığı bakımından en yakın olan paragraf seçimi uygulanmıştır. Çıkan sonuçlar kontrol edildiğinde ikinci yöntemin daha başarılı bir sonuç verdiği gözlemlenmiştir. İkinci yönteme göre başarı oranları %20 özet oranı için %40 , %40 özet oranı için %50 ve %60 özet oranı için %71 elde edilmiştir.

Keywords

References

  1. H. P., Lunh, “The Automatic Creation of Literature Abstracts,” IBM Journal, ss. 159-165, 1958.
  2. H.P., Edmundson, “New Methods in Automatic Abstracting,” Journal of the ACM, ss. 264-285, 1969.
  3. Brandow, Ron, Karl Mitze, and Lisa Ram, “Automatic condensation of electronic publications by sentence selection,” Information Processing and Management, c. 31, s. 5,ss. 675-685, 1995.
  4. Meng Wang, Xiaorong Wang, Chungui Li, “Extracting Multi-document Summarization Based on Local Topics,” 2009 Sixth International Conference on Fuzzy Systems and Knowledge Discovery, 2009.
  5. Jade Goldstein, Vibhu Mittal, Jaime Carbonell, Mark Kantrowitzt, “Multi-Document Summarization By Sentence Extraction,” NAACL-ANLP-AutoSum '00 Proceedings of the 2000 NAACL-ANLP Workshop on Automatic Summarization, ss. 40-48, 2000.
  6. Jaruskulchai, C. ve Kruengkrai, C., “A Practical Text Summarizer by Paragraph Extraction for Thai,” The Sixth International Workshop on Information Retrieval with Asian Language, ss. 9-16, 2003.
  7. Ebru Uzundere, Elda Dedja, Banu Diri, M.Fatih Amasyalı, “Türkçe Haber Metinleri İçin Otomatik Özetleme,” Akıllı Sistemlerde Yenilikler ve Uygulamaları Sempozyumu, 2008.
  8. Fumiyo Fukumoto ve Yoshimi Suzuki, “Extracting key paragraph based on topic and event detection: towards multi-document summarization,” NAACL-ANLP-AutoSum '00 Proceedings of the 2000 NAACL-ANLPWorkshop on Automatic summarization, c.4, ss. 31-39, 2000.

Details

Primary Language

Turkish

Subjects

Engineering

Journal Section

Research Article

Publication Date

August 1, 2018

Submission Date

April 25, 2018

Acceptance Date

June 13, 2018

Published in Issue

Year 2018 Volume: 6 Number: 4

APA
Kısayol, A. İ., & Turan, M. (2018). Paragraf Tabanlı Çıkarımsal Özetlemede Öbekleme Kullanan İki Yeni Yöntemin Kıyaslanması. Duzce University Journal of Science and Technology, 6(4), 1047-1057. https://doi.org/10.29130/dubited.418453
AMA
1.Kısayol Aİ, Turan M. Paragraf Tabanlı Çıkarımsal Özetlemede Öbekleme Kullanan İki Yeni Yöntemin Kıyaslanması. DUBİTED. 2018;6(4):1047-1057. doi:10.29130/dubited.418453
Chicago
Kısayol, Ahmet İlkay, and Metin Turan. 2018. “Paragraf Tabanlı Çıkarımsal Özetlemede Öbekleme Kullanan İki Yeni Yöntemin Kıyaslanması”. Duzce University Journal of Science and Technology 6 (4): 1047-57. https://doi.org/10.29130/dubited.418453.
EndNote
Kısayol Aİ, Turan M (August 1, 2018) Paragraf Tabanlı Çıkarımsal Özetlemede Öbekleme Kullanan İki Yeni Yöntemin Kıyaslanması. Duzce University Journal of Science and Technology 6 4 1047–1057.
IEEE
[1]A. İ. Kısayol and M. Turan, “Paragraf Tabanlı Çıkarımsal Özetlemede Öbekleme Kullanan İki Yeni Yöntemin Kıyaslanması”, DUBİTED, vol. 6, no. 4, pp. 1047–1057, Aug. 2018, doi: 10.29130/dubited.418453.
ISNAD
Kısayol, Ahmet İlkay - Turan, Metin. “Paragraf Tabanlı Çıkarımsal Özetlemede Öbekleme Kullanan İki Yeni Yöntemin Kıyaslanması”. Duzce University Journal of Science and Technology 6/4 (August 1, 2018): 1047-1057. https://doi.org/10.29130/dubited.418453.
JAMA
1.Kısayol Aİ, Turan M. Paragraf Tabanlı Çıkarımsal Özetlemede Öbekleme Kullanan İki Yeni Yöntemin Kıyaslanması. DUBİTED. 2018;6:1047–1057.
MLA
Kısayol, Ahmet İlkay, and Metin Turan. “Paragraf Tabanlı Çıkarımsal Özetlemede Öbekleme Kullanan İki Yeni Yöntemin Kıyaslanması”. Duzce University Journal of Science and Technology, vol. 6, no. 4, Aug. 2018, pp. 1047-5, doi:10.29130/dubited.418453.
Vancouver
1.Ahmet İlkay Kısayol, Metin Turan. Paragraf Tabanlı Çıkarımsal Özetlemede Öbekleme Kullanan İki Yeni Yöntemin Kıyaslanması. DUBİTED. 2018 Aug. 1;6(4):1047-5. doi:10.29130/dubited.418453

Cited By