Research Article
BibTex RIS Cite

Metin Madenciliği ile Shakespeare Külliyatının İncelenmesi

Year 2020, Volume: 9 Issue: 3, 1343 - 1357, 21.07.2020
https://doi.org/10.33206/mjss.561919

Abstract

Metin
madenciliği, doğal dil metninde yer alan yapılandırılmamış (metin) verilerin
çeşitli yöntem, araç ve tekniklerin kullanılarak analiz edilmesidir.
Bugün, kurum ve
kuruluşların çoğu, veri ambarlarında ve bulut platformlarında büyük miktarda
veri toplamakta ve depolamaktadır. Bu veriler, birden fazla kaynaktan gelen
yeni verilerin gelmesiyle birlikte, üssel olarak artmaya devam etmektedir.
Şirketlerin ve kuruluşların geleneksel araçlarla büyük miktardaki metin
verilerini depolaması, işlemesi ve analiz etmesi zordur. Bugün, gelişen Tableau
gibi yazılımlar sayesinde bu problemler ortadan kalkmıştır. Bu çalışmanın
amacı; metin madenciliği yöntemi ile Shakespeare eserlerindeki kahramanları ve
olay örgülerini istatistiksel olarak saptamak ve edebiyat alanında çalışanlara
bazı öngörüler sağlamaktır. Bu amaçla çalışmada, Tableau yazılımı kullanılarak
Google BigQuery’nin alt yapısında bulunan Shakespeare veri setine kelime
frekansları, görselleştirme ve kümeleme analiz yöntemi uygulanmıştır. Kümeleme
analizi sonucunda “Hamlet” kelimesinin tüm eserlerin merkezinde yer aldığı ve
Hamlet’in Shakespeare’in en önemli eseri olduğu bulunmuştur. Ayrıca, “Romeo ve
Juliet” eserinde sırasıyla; “Romeo”, “Juliet” ve “Love” en çok kullanılan
kelimeler olarak bulunmuştur. Elde edilen bu bulgulardan eserin ana
karakterlerinin “Romeo” ve “Juliet”, konusunun ise “aşk” olduğu sonucuna
varılmıştır.  

References

  • Arslan, H., Kaynar, O., & Yüksek, A. G. (2015). Kurumsal Kolektif Süreçler için E-Posta İletilerinden Görev Keşfi ve Gerçek Zamanlı Görev Yönetim Sisteminin Geliştirilmesi. Bilişim Teknolojileri Dergisi, 10(4), 381-388.
  • Azzalini, A., & Scarpa, B. (2012). Data analysis and data mining: An introduction. OUP USA.
  • Bose, B. (2018). Techniques and Aplications of Text Mining. https://www.digitalvidya.com/blog/techniques-applications-text-mining/, (Erişim Tarihi: 10.06.2018).
  • Bozyiğit, F. (2015). Analyzing source code and detecting similarities, M.Sc Thesis, Dokuz Eylül University, Izmir.
  • Coursehero (2019). Terim frekanı tf bir doküman içerisinde bir. https://www.coursehero.com/file/p14lar0/Terim-Frekans, (Erişim Tarihi: 20.01.2019).
  • Delibaş, A., (2008). Doğal Dil İşleme İle Türkçe Yazım Hatalarının Denetlenmesi, Yüksek Lisans Tezi, İstanbul Teknik Üniversitesi, İstanbul, Türkiye.
  • Dinçer, E. (2006). Veri Madenciliğinde K-Means Algoritması ve Tıp Alanında Uygulanması, Yüksek Lisans Tezi, Kocaeli Üniversitesi, Fen Bilimleri Enstitüsü, Kocaeli, 101s.
  • Dolgun, M. Ö., Özdemir, T. G., & Oğuz, D. (2009). Veri madenciliğiâ nde yapısal olmayan verinin analizi: Metin ve web madenciliği. İstatistikçiler Dergisi: İstatistik ve Aktüerya, 2(2), 48-58.
  • Evans, S., Lioyd, J., Stoddard, G., Nekeber, J., Samone, M. 2005. Risk Factors For Adverse Drug Events. The Annals of Pharmacotherapy, 39, 1161-1168.
  • Gaikwad, S. V., Chaugule, A., & Patil, P. (2014). Text mining methods and techniques. International Journal of Computer Applications, 85(17).
  • Hotho, A., Nürnberger, A., & Paaß, G. (2005, May). A brief survey of text mining. In Ldv Forum (Vol. 20, No. 1, pp. 19-62).
  • Işık, M. (2006). Bölünmeli kümeleme yöntemleri ile veri madenciliği uygulamaları. Y. Lisans Tezi, Fen Bilimleri Enstitüsü, Marmara Üniversitesi, İstanbul.
  • İlhan, S., Duru, N., Karagöz, Ş., & Sağır, M. (2008). Metin Madenciliği ile Soru Cevaplama Sistemi. Elektronik ve Bilgisayar Mühendisliği Sempozyumu (ELECO), Bursa, 26-30.
  • Jain, A. K., Murty, M. N., & Flynni, P. J. (1999). Data clustering: a review. ACM computing surveys (CSUR), 31(3), 264-323.
  • Kaşıkçı, T., & Gökçen, H. (2014). Metin Madenciliği İle E-Ticaret Sitelerinin Belirlenmesi. Bilişim Teknolojileri Dergisi, 7(1).
  • Kılınç, D., Borandağ, E., Yücalar, F., Tunalı, V., Şimşek, M., & Özçift, A. (2016). KNN algoritması ve r dili ile metin madenciliği kullanılarak bilimsel makale tasnifi. DOI: 10.7240/mufbed.69674
  • Linguamatics (2018). What is NLP Text Mining?. https://www.linguamatics.com/what-is-text-mining-nlp-machine-learning, (Erişim Tarihi: 20.12.2018).
  • Mane, S. (2018). What are the application of text mining?. https://www.quora.com/What-are-the-applications-of-text-mining/answer/Sayali-Mane-16, (Erişim Tarihi: 23.04.2018).
  • Maria, L. (2018). Understanding and Writing your first Text Mining Script with R. https://towardsdatascience.com/understanding-and-writing-your-first-text-mining-script-with-r-c74a7efbe30f, (Erişim Tarihi: 11.01.2018).
  • Padhy, N., Mishra, D., & Panigrahi, R. (2012). The survey of data mining applications and feature scope. arXiv preprint arXiv:1211.5723.
  • Pat Reserch (2018). Top Free Software for Text Analysis Text Mining Text Analytics. https://www.predictiveanalyticstoday.com/top-free-software-for-text-analysis-text-mining-text-analytics/, (Erişim Tarihi: 10.12.2018).
  • Port (2018). An introduction to text mining. https://port.sas.ac.uk/mod/book/view.php?id=554&chapterid=325, (Erişim Tarihi: 22.12.2018).
  • Rouse, M. (2018). Text mining (text Analytics). https://searchbusinessanalytics.techtarget.com/definition/text-mining, (Erişim Tarihi: 20.12.2018).
  • Rai, A. (2018). What is Text Mining: Techniques and Applications. https://www.upgrad.com/blog/what-is-text-mining-techniques-and-applications/, (Erişim Tarihi: 13.06.2018).
  • Seker, S. E., Mert, C., Al-Naami, K., Ozalp, N., & Ayan, U. (2013). Correlation between the economy news and stock market in Turkey. International Journal of Business Intelligence Research (IJBIR), 4(4), 1-21.
  • Seker, S. E. (2015). Metin Madenciliği (Text Mining). YBS Ansiklopedi, 2(3), 30-32.
  • Sagayam, R., Sriniyasan, S., & Roshni, S. (2012). A survey of text mining: Retrieval, extraction and indexing techniques. International Journal of Computational Engineering Research, 2(5), 1443.
  • Tableau (2018). Find Cluster in Data. https://onlinehelp.tableau.com/v2018.3/pro/desktop/en-us/clustering.htm#HowItWorks, (Erişim Tarihi: 25.12.2018).
  • Talib, R., Hanif, M. K., Ayesha, S., & Fatima, F. (2016). Text mining: techniques, applications and issues. International Journal of Advanced Computer Science and Applications, 7(11), 414-418.
  • Weiss, S. M., Indurkhya, N., Zhang, T., & Damerau, F. (2010). Text mining: predictive methods for analyzing unstructured information. Springer Science & Business Media.
  • Williams, J. (2018). 9 Best Applications of Text Data Mining and Analysisis. https://www.promptcloud.com/blog/9-best-examples-of-text-mining-analysis, (Erişim Tarihi: 06.08.2018).
Year 2020, Volume: 9 Issue: 3, 1343 - 1357, 21.07.2020
https://doi.org/10.33206/mjss.561919

Abstract

References

  • Arslan, H., Kaynar, O., & Yüksek, A. G. (2015). Kurumsal Kolektif Süreçler için E-Posta İletilerinden Görev Keşfi ve Gerçek Zamanlı Görev Yönetim Sisteminin Geliştirilmesi. Bilişim Teknolojileri Dergisi, 10(4), 381-388.
  • Azzalini, A., & Scarpa, B. (2012). Data analysis and data mining: An introduction. OUP USA.
  • Bose, B. (2018). Techniques and Aplications of Text Mining. https://www.digitalvidya.com/blog/techniques-applications-text-mining/, (Erişim Tarihi: 10.06.2018).
  • Bozyiğit, F. (2015). Analyzing source code and detecting similarities, M.Sc Thesis, Dokuz Eylül University, Izmir.
  • Coursehero (2019). Terim frekanı tf bir doküman içerisinde bir. https://www.coursehero.com/file/p14lar0/Terim-Frekans, (Erişim Tarihi: 20.01.2019).
  • Delibaş, A., (2008). Doğal Dil İşleme İle Türkçe Yazım Hatalarının Denetlenmesi, Yüksek Lisans Tezi, İstanbul Teknik Üniversitesi, İstanbul, Türkiye.
  • Dinçer, E. (2006). Veri Madenciliğinde K-Means Algoritması ve Tıp Alanında Uygulanması, Yüksek Lisans Tezi, Kocaeli Üniversitesi, Fen Bilimleri Enstitüsü, Kocaeli, 101s.
  • Dolgun, M. Ö., Özdemir, T. G., & Oğuz, D. (2009). Veri madenciliğiâ nde yapısal olmayan verinin analizi: Metin ve web madenciliği. İstatistikçiler Dergisi: İstatistik ve Aktüerya, 2(2), 48-58.
  • Evans, S., Lioyd, J., Stoddard, G., Nekeber, J., Samone, M. 2005. Risk Factors For Adverse Drug Events. The Annals of Pharmacotherapy, 39, 1161-1168.
  • Gaikwad, S. V., Chaugule, A., & Patil, P. (2014). Text mining methods and techniques. International Journal of Computer Applications, 85(17).
  • Hotho, A., Nürnberger, A., & Paaß, G. (2005, May). A brief survey of text mining. In Ldv Forum (Vol. 20, No. 1, pp. 19-62).
  • Işık, M. (2006). Bölünmeli kümeleme yöntemleri ile veri madenciliği uygulamaları. Y. Lisans Tezi, Fen Bilimleri Enstitüsü, Marmara Üniversitesi, İstanbul.
  • İlhan, S., Duru, N., Karagöz, Ş., & Sağır, M. (2008). Metin Madenciliği ile Soru Cevaplama Sistemi. Elektronik ve Bilgisayar Mühendisliği Sempozyumu (ELECO), Bursa, 26-30.
  • Jain, A. K., Murty, M. N., & Flynni, P. J. (1999). Data clustering: a review. ACM computing surveys (CSUR), 31(3), 264-323.
  • Kaşıkçı, T., & Gökçen, H. (2014). Metin Madenciliği İle E-Ticaret Sitelerinin Belirlenmesi. Bilişim Teknolojileri Dergisi, 7(1).
  • Kılınç, D., Borandağ, E., Yücalar, F., Tunalı, V., Şimşek, M., & Özçift, A. (2016). KNN algoritması ve r dili ile metin madenciliği kullanılarak bilimsel makale tasnifi. DOI: 10.7240/mufbed.69674
  • Linguamatics (2018). What is NLP Text Mining?. https://www.linguamatics.com/what-is-text-mining-nlp-machine-learning, (Erişim Tarihi: 20.12.2018).
  • Mane, S. (2018). What are the application of text mining?. https://www.quora.com/What-are-the-applications-of-text-mining/answer/Sayali-Mane-16, (Erişim Tarihi: 23.04.2018).
  • Maria, L. (2018). Understanding and Writing your first Text Mining Script with R. https://towardsdatascience.com/understanding-and-writing-your-first-text-mining-script-with-r-c74a7efbe30f, (Erişim Tarihi: 11.01.2018).
  • Padhy, N., Mishra, D., & Panigrahi, R. (2012). The survey of data mining applications and feature scope. arXiv preprint arXiv:1211.5723.
  • Pat Reserch (2018). Top Free Software for Text Analysis Text Mining Text Analytics. https://www.predictiveanalyticstoday.com/top-free-software-for-text-analysis-text-mining-text-analytics/, (Erişim Tarihi: 10.12.2018).
  • Port (2018). An introduction to text mining. https://port.sas.ac.uk/mod/book/view.php?id=554&chapterid=325, (Erişim Tarihi: 22.12.2018).
  • Rouse, M. (2018). Text mining (text Analytics). https://searchbusinessanalytics.techtarget.com/definition/text-mining, (Erişim Tarihi: 20.12.2018).
  • Rai, A. (2018). What is Text Mining: Techniques and Applications. https://www.upgrad.com/blog/what-is-text-mining-techniques-and-applications/, (Erişim Tarihi: 13.06.2018).
  • Seker, S. E., Mert, C., Al-Naami, K., Ozalp, N., & Ayan, U. (2013). Correlation between the economy news and stock market in Turkey. International Journal of Business Intelligence Research (IJBIR), 4(4), 1-21.
  • Seker, S. E. (2015). Metin Madenciliği (Text Mining). YBS Ansiklopedi, 2(3), 30-32.
  • Sagayam, R., Sriniyasan, S., & Roshni, S. (2012). A survey of text mining: Retrieval, extraction and indexing techniques. International Journal of Computational Engineering Research, 2(5), 1443.
  • Tableau (2018). Find Cluster in Data. https://onlinehelp.tableau.com/v2018.3/pro/desktop/en-us/clustering.htm#HowItWorks, (Erişim Tarihi: 25.12.2018).
  • Talib, R., Hanif, M. K., Ayesha, S., & Fatima, F. (2016). Text mining: techniques, applications and issues. International Journal of Advanced Computer Science and Applications, 7(11), 414-418.
  • Weiss, S. M., Indurkhya, N., Zhang, T., & Damerau, F. (2010). Text mining: predictive methods for analyzing unstructured information. Springer Science & Business Media.
  • Williams, J. (2018). 9 Best Applications of Text Data Mining and Analysisis. https://www.promptcloud.com/blog/9-best-examples-of-text-mining-analysis, (Erişim Tarihi: 06.08.2018).
There are 31 citations in total.

Details

Primary Language Turkish
Journal Section Research Article
Authors

Sadullah Çelik 0000-0001-5468-475X

Publication Date July 21, 2020
Submission Date May 8, 2019
Published in Issue Year 2020 Volume: 9 Issue: 3

Cite

APA Çelik, S. (2020). Metin Madenciliği ile Shakespeare Külliyatının İncelenmesi. MANAS Sosyal Araştırmalar Dergisi, 9(3), 1343-1357. https://doi.org/10.33206/mjss.561919
AMA Çelik S. Metin Madenciliği ile Shakespeare Külliyatının İncelenmesi. MJSS. July 2020;9(3):1343-1357. doi:10.33206/mjss.561919
Chicago Çelik, Sadullah. “Metin Madenciliği Ile Shakespeare Külliyatının İncelenmesi”. MANAS Sosyal Araştırmalar Dergisi 9, no. 3 (July 2020): 1343-57. https://doi.org/10.33206/mjss.561919.
EndNote Çelik S (July 1, 2020) Metin Madenciliği ile Shakespeare Külliyatının İncelenmesi. MANAS Sosyal Araştırmalar Dergisi 9 3 1343–1357.
IEEE S. Çelik, “Metin Madenciliği ile Shakespeare Külliyatının İncelenmesi”, MJSS, vol. 9, no. 3, pp. 1343–1357, 2020, doi: 10.33206/mjss.561919.
ISNAD Çelik, Sadullah. “Metin Madenciliği Ile Shakespeare Külliyatının İncelenmesi”. MANAS Sosyal Araştırmalar Dergisi 9/3 (July 2020), 1343-1357. https://doi.org/10.33206/mjss.561919.
JAMA Çelik S. Metin Madenciliği ile Shakespeare Külliyatının İncelenmesi. MJSS. 2020;9:1343–1357.
MLA Çelik, Sadullah. “Metin Madenciliği Ile Shakespeare Külliyatının İncelenmesi”. MANAS Sosyal Araştırmalar Dergisi, vol. 9, no. 3, 2020, pp. 1343-57, doi:10.33206/mjss.561919.
Vancouver Çelik S. Metin Madenciliği ile Shakespeare Külliyatının İncelenmesi. MJSS. 2020;9(3):1343-57.

MANAS Journal of Social Studies