Araştırma Makalesi
BibTex RIS Kaynak Göster

Graf Teorisi ve Malatya Merkezilik Algoritmasına Dayalı Haber Metinlerinin Özetlemesi

Yıl 2024, , 189 - 198, 31.07.2024
https://doi.org/10.17671/gazibtd.1463107

Öz

Günümüzde internetin yaygın kullanımıyla, bilgi kaynaklarındaki doğru bilgiye erişimi önemli kılmaktadır. Bilgi kaynaklarının artmasıyla birlikte özgün içeriğe sahip bilgiye erişim güçleşmektedir. Bu nedenle metin özetleme yöntemlerinin önemi giderek artmaktadır. Haber metinleri gibi önemli temel bilgi kaynaklarının etkili bir şekilde özetlenmesi günümüzde bir gereklilik haline gelmiştir. Bu çalışmada haber metinlerinin etkili bir şekilde özetlenmesi için Malatya merkezilik algoritmasını temel alan bir özetleme yaklaşımı önerildi. Önerilen yaklaşımda orijinal metin tanımlayıcıların çıkarılması, kelime köklerinin elde edilmesi gibi çeşitli ön işlemlerden geçirilerek graf yapısına dönüştürülür. Graf’a dönüştürülen metin için Malatya merkezilik algoritması kullanılarak graftaki düğümlerin Malatya merkezilik değerleri hesaplanır. Bu değerler dikkate alınarak metin özetini oluşturan özetler seçilir. Seçilen özetler graftan çıkarılır. Oluşan yeni graf yapısı için merkezilik değeri hesaplanarak seçim işlemleri devam ettirilir. Graf Teorisi ve Malatya merkezilik algoritmasının birlikte kullanımı, haber metinlerinin özetlenmesinde verimliliği artırdığı gösterildi. Bununla birlikte haber içeriklerinin anlamlı bir şekilde özetlenmesi sağlandı. Bu yaklaşımın başarısını değerlendirmek amacıyla BBC veri seti üzerinde toplamda 2224 ingilizce haber metniyle kapsamlı bir şekilde test edildi. Çalışmada haber metinleri etkili bir şekilde özetlendiği yapılan testlerle ve alınan etkili rouge değerleriyle gösterildi. Graf teorisi ve Malatya merkezilik algoritması, bilgiye erişimi kolaylaştırmak ve anlam düzeyinde etkileşimi artırmak adına önemli bir potansiyele sahip olduğu gösterildi. Elde edilen uygulama sonuçları, haber metinlerini daha anlamlı bir şekilde sunabileceğini ve etkili özetler üretilebileceğini göstermektedir.

Kaynakça

  • Yakut, S., Oztemiz, F., & Karci, A. "A New Approach Based on Centrality Value in Solving the Minimum Vertex Cover Problem: Malatya Centrality Algorithm." Computer Science. Volume Vol:7, Issue Issue:2, 81 - 88. (07.12.2022)
  • Bakan, C. & Yakut, S. "Development of Text Summarization Method based on Graph Theory and Malatya Centrality Algorithm." Computer Science. Volume: IDAP-2023. (18.10.2023)
  • Yakut, S., Öztemiz, F., & Karcı, A. "A New Approach Based on Centrality Value in Solving the Maximum Independent Set Problem: Malatya Centrality Algorithm." Computer Science, Vol:8(Issue:1), 16-23. (2023)
  • Tülek, M. "Türkçe için Metin Özetleme." (2007)
  • Khushboo S. Thakkar, R.V. Dharaskar, & M.B. Chandak. "Graph-Based Algorithms for Text Summarization." IEEE. 10.1109/ICETET.2010.104. (2010)
  • Güneş Erkan, & Dragomir R. Radev. "LexRank: Graph-based Lexical Centrality as Salience in Text Summarization." (2004)
  • Ibrahim F. Moawad, & Mostafa Aref. "Semantic Graph Reduction Approach for Abstractive Text Summarization." IEEE. 10.1109/ICCES.2012.6408498. (2013)
  • Rafael Ferreira, Frederico Freitas, Luciano de Souza Cabral, Rafael Dueire Lins, Rinaldo Lima, Gabriel França, Steven J. Simskez, & Luciano Favaro. "A Four Dimension Graph Model for Automatic Text Summarization." IEEE. 10.1109/WI-IAT.2013.55. (2013)
  • Chirantana Mallick, Ajit Kumar Das, Madhurima Dutta, Asit Kumar Das, & Apurba Sarkar. "Graph-Based Text Summarization Using Modified TextRank." Springer. (2018)
  • Yogesh Sankarasubramaniam, Krishnan Ramanathan, & Subhankar Ghosh. "Text Summarization using Wikipedia." ScienceDirect. (2014)
  • Rasim Alguliev, & Ramiz Aliguliyev. "Evolutionary Algorithm for Extractive Text Summarization." Scientific Research. (2009)
  • Naresh Kumar Nagwani, & Dr. Shrish Verma. "A Frequent Term and Semantic Similarity based Single Document Text Summarization Algorithm." ResearchGate. (2011)
  • Rada Mihalcea. "Graph-based Ranking Algorithms for Sentence Extraction, Applied to Text Summarization." (2004)
  • Sumya Akter, Aysa Siddika Asa, Md. Palash Uddin, Md. Delowar Hossain, Shikhor Kumer Roy, & Masud Ibn Afjal. "An Extractive Text Summarization Technique for Bengali Document(s) Using K-means Clustering Algorithm." IEEE. 10.1109/ICIVPR.2017.7890883. (2017)
  • S.A. Babar, & Pallavi D. Patil. "Improving Performance of Text Summarization." ScienceDirect. (2015)
  • Makbule Gulcin Ozsoy, & Ferda Nur Alpaslan. "Text Summarization using Latent Semantic Analysis." 10.1177/0165551511408848. (2011)
  • Erhandı, B. "Derin Öğrenme ile Metin Özetleme." (2020) Joel Larocca Neto, Alex A. Freitas, & Celso A. A. Kaestner. "Automatic Text Summarization Using a Machine Learning Approach." Springer. (2003)
  • Carlos N. Silla Jr., Gisele L. Pappa, Alex A. Freitas, & Celso A. A. Kaestner. "Automatic Text Summarization with Genetic Algorithm-Based Attribute Selection." Springer. (2004)
  • O. Kaynar, Y. E. Işık, Y. Görmez, ve F. Demirkoparan, “Otomatik Metin Özetleme için Genetik Algoritma Tabanlı Cümle Çıkarımı”, Yönetim Bilişim Sistemleri Dergisi, c. 3, sy. 2, ss. 62–75, 2017.
  • Raed Z. Al-Abdallah, & Ahmad T. Al-Taani. "Arabic Single-Document Text Summarization Using Particle Swarm Optimization Algorithm." ScienceDirect. (2017)
  • Abdullah Ammar Karcioğlu & Ahmet Cahit Yaşa. "Automatic Summary Extraction in Texts Using Genetic Algorithms." IEEE. (2021) Enise Karakoç, Burcu Yılmaz. "Deep Learning Based Abstractive Turkish News Summarization." IEEE. (2019)
  • Hakan Torun, A. Burak İnner. "A Method for Similarity Detection in Vector Space by Summarizing News Articles." IEEE. (2022) Yavuz Selim Kartal, Mucahid Kutlu. "Machine Learning Based Text Summarization for Turkish News." IEEE. (2021)
  • Hark, C., Taner Uçkan, T., Seyyarer, E., & Karcı, A. "Metin Özetlemesi için Düğüm Merkezliklerine Dayalı Denetimsiz Bir Yaklaşım." dergipark, 8(3). (30.09.2019)
  • Mengqian Wang, Manhua Wang, Fei Yu, Yue Yang, Jennifer Walker, Javed Mostafa. "A Systematic Review of Automatic Text Summarization for Biomedical Literature and EHRs." Journal of the American Medical Informatics Association, Volume 28, Issue 10, October. (2021)
  • Kumar, Y., Kaur, K. & Kaur, S. "Study of Automatic Text Summarization Approaches in Different Languages." Artif Intell Rev 54, 5897–5929. (2021)
  • Taner Uçkan, Cengiz Hark & Ali Karci. "SSC: Clustering of Turkish Texts by Spectral Graph Partitioning." Politeknik Dergisi. (2021)
  • Aydın, A., & Uçkan, T. "Çizgeler Üzerinde Farklı Ağırlıklandırma Yöntemleri Ve Merkezilik Ölçütleri İle Çıkarımsal Metin Özetleme." Fırat Üniversitesi Mühendislik Bilimleri Dergisi, 35(1), 71-79. (2023)
  • Kuş, A., & Acı, Ç. İ. "An Extractive Text Summarization Model for Generating Extended Abstracts of Medical Papers in Turkish." Bilgisayar Bilimleri Ve Teknolojileri Dergisi, 4(1), 19-26. (2023)

Summarization of News Texts Based on Graph Theory and Malatya Centrality Algorithm

Yıl 2024, , 189 - 198, 31.07.2024
https://doi.org/10.17671/gazibtd.1463107

Öz

The widespread use of the internet today highlights the importance of accessing accurate information from reliable sources. With the proliferation of information sources, accessing original content has become increasingly challenging. Therefore, the importance of text summarization methods is steadily increasing. Effectively summarizing essential information sources such as news articles has become a necessity. In this study, an approach based on the Malatya centrality algorithm is proposed for effectively summarizing news articles. In the proposed approach, various preprocessing steps such as extracting descriptive terms and obtaining word roots are applied to transform the original text into a graph structure. The Malatya centrality algorithm is then utilized to calculate the centrality values of nodes in the graph representing the text. Based on these values, summaries constituting the text summary are selected. The selected summaries are removed from the graph. Centrality values are then calculated for the resulting new graph structure, and the selection process continues. The combined use of Graph Theory and the Malatya centrality algorithm is shown to enhance efficiency in summarizing news articles. Additionally, meaningful summarization of news content is achieved. To evaluate the success of this approach, it was comprehensively tested on a total of 2224 English news articles from the BBC dataset. The study demonstrates effective summarization of news articles through conducted tests and achieved effective ROUGE scores. The utilization of Graph Theory and the Malatya centrality algorithm is shown to have significant potential in facilitating information access and increasing interaction at the semantic level. The obtained application results indicate the ability to present news articles in a more meaningful manner and produce effective summaries.

Kaynakça

  • Yakut, S., Oztemiz, F., & Karci, A. "A New Approach Based on Centrality Value in Solving the Minimum Vertex Cover Problem: Malatya Centrality Algorithm." Computer Science. Volume Vol:7, Issue Issue:2, 81 - 88. (07.12.2022)
  • Bakan, C. & Yakut, S. "Development of Text Summarization Method based on Graph Theory and Malatya Centrality Algorithm." Computer Science. Volume: IDAP-2023. (18.10.2023)
  • Yakut, S., Öztemiz, F., & Karcı, A. "A New Approach Based on Centrality Value in Solving the Maximum Independent Set Problem: Malatya Centrality Algorithm." Computer Science, Vol:8(Issue:1), 16-23. (2023)
  • Tülek, M. "Türkçe için Metin Özetleme." (2007)
  • Khushboo S. Thakkar, R.V. Dharaskar, & M.B. Chandak. "Graph-Based Algorithms for Text Summarization." IEEE. 10.1109/ICETET.2010.104. (2010)
  • Güneş Erkan, & Dragomir R. Radev. "LexRank: Graph-based Lexical Centrality as Salience in Text Summarization." (2004)
  • Ibrahim F. Moawad, & Mostafa Aref. "Semantic Graph Reduction Approach for Abstractive Text Summarization." IEEE. 10.1109/ICCES.2012.6408498. (2013)
  • Rafael Ferreira, Frederico Freitas, Luciano de Souza Cabral, Rafael Dueire Lins, Rinaldo Lima, Gabriel França, Steven J. Simskez, & Luciano Favaro. "A Four Dimension Graph Model for Automatic Text Summarization." IEEE. 10.1109/WI-IAT.2013.55. (2013)
  • Chirantana Mallick, Ajit Kumar Das, Madhurima Dutta, Asit Kumar Das, & Apurba Sarkar. "Graph-Based Text Summarization Using Modified TextRank." Springer. (2018)
  • Yogesh Sankarasubramaniam, Krishnan Ramanathan, & Subhankar Ghosh. "Text Summarization using Wikipedia." ScienceDirect. (2014)
  • Rasim Alguliev, & Ramiz Aliguliyev. "Evolutionary Algorithm for Extractive Text Summarization." Scientific Research. (2009)
  • Naresh Kumar Nagwani, & Dr. Shrish Verma. "A Frequent Term and Semantic Similarity based Single Document Text Summarization Algorithm." ResearchGate. (2011)
  • Rada Mihalcea. "Graph-based Ranking Algorithms for Sentence Extraction, Applied to Text Summarization." (2004)
  • Sumya Akter, Aysa Siddika Asa, Md. Palash Uddin, Md. Delowar Hossain, Shikhor Kumer Roy, & Masud Ibn Afjal. "An Extractive Text Summarization Technique for Bengali Document(s) Using K-means Clustering Algorithm." IEEE. 10.1109/ICIVPR.2017.7890883. (2017)
  • S.A. Babar, & Pallavi D. Patil. "Improving Performance of Text Summarization." ScienceDirect. (2015)
  • Makbule Gulcin Ozsoy, & Ferda Nur Alpaslan. "Text Summarization using Latent Semantic Analysis." 10.1177/0165551511408848. (2011)
  • Erhandı, B. "Derin Öğrenme ile Metin Özetleme." (2020) Joel Larocca Neto, Alex A. Freitas, & Celso A. A. Kaestner. "Automatic Text Summarization Using a Machine Learning Approach." Springer. (2003)
  • Carlos N. Silla Jr., Gisele L. Pappa, Alex A. Freitas, & Celso A. A. Kaestner. "Automatic Text Summarization with Genetic Algorithm-Based Attribute Selection." Springer. (2004)
  • O. Kaynar, Y. E. Işık, Y. Görmez, ve F. Demirkoparan, “Otomatik Metin Özetleme için Genetik Algoritma Tabanlı Cümle Çıkarımı”, Yönetim Bilişim Sistemleri Dergisi, c. 3, sy. 2, ss. 62–75, 2017.
  • Raed Z. Al-Abdallah, & Ahmad T. Al-Taani. "Arabic Single-Document Text Summarization Using Particle Swarm Optimization Algorithm." ScienceDirect. (2017)
  • Abdullah Ammar Karcioğlu & Ahmet Cahit Yaşa. "Automatic Summary Extraction in Texts Using Genetic Algorithms." IEEE. (2021) Enise Karakoç, Burcu Yılmaz. "Deep Learning Based Abstractive Turkish News Summarization." IEEE. (2019)
  • Hakan Torun, A. Burak İnner. "A Method for Similarity Detection in Vector Space by Summarizing News Articles." IEEE. (2022) Yavuz Selim Kartal, Mucahid Kutlu. "Machine Learning Based Text Summarization for Turkish News." IEEE. (2021)
  • Hark, C., Taner Uçkan, T., Seyyarer, E., & Karcı, A. "Metin Özetlemesi için Düğüm Merkezliklerine Dayalı Denetimsiz Bir Yaklaşım." dergipark, 8(3). (30.09.2019)
  • Mengqian Wang, Manhua Wang, Fei Yu, Yue Yang, Jennifer Walker, Javed Mostafa. "A Systematic Review of Automatic Text Summarization for Biomedical Literature and EHRs." Journal of the American Medical Informatics Association, Volume 28, Issue 10, October. (2021)
  • Kumar, Y., Kaur, K. & Kaur, S. "Study of Automatic Text Summarization Approaches in Different Languages." Artif Intell Rev 54, 5897–5929. (2021)
  • Taner Uçkan, Cengiz Hark & Ali Karci. "SSC: Clustering of Turkish Texts by Spectral Graph Partitioning." Politeknik Dergisi. (2021)
  • Aydın, A., & Uçkan, T. "Çizgeler Üzerinde Farklı Ağırlıklandırma Yöntemleri Ve Merkezilik Ölçütleri İle Çıkarımsal Metin Özetleme." Fırat Üniversitesi Mühendislik Bilimleri Dergisi, 35(1), 71-79. (2023)
  • Kuş, A., & Acı, Ç. İ. "An Extractive Text Summarization Model for Generating Extended Abstracts of Medical Papers in Turkish." Bilgisayar Bilimleri Ve Teknolojileri Dergisi, 4(1), 19-26. (2023)
Toplam 28 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Bilgi Sistemleri (Diğer), Bilgisayar Yazılımı, Yazılım Mühendisliği (Diğer)
Bölüm Makaleler
Yazarlar

Cevher Tayyib Bakan 0009-0003-7626-6884

Selman Yakut 0000-0002-0649-1993

Yayımlanma Tarihi 31 Temmuz 2024
Gönderilme Tarihi 1 Nisan 2024
Kabul Tarihi 16 Mayıs 2024
Yayımlandığı Sayı Yıl 2024

Kaynak Göster

APA Bakan, C. T., & Yakut, S. (2024). Graf Teorisi ve Malatya Merkezilik Algoritmasına Dayalı Haber Metinlerinin Özetlemesi. Bilişim Teknolojileri Dergisi, 17(3), 189-198. https://doi.org/10.17671/gazibtd.1463107