Metin
madenciliği, doğal dil metninde yer alan yapılandırılmamış (metin) verilerin
çeşitli yöntem, araç ve tekniklerin kullanılarak analiz edilmesidir. Bugün, kurum ve
kuruluşların çoğu, veri ambarlarında ve bulut platformlarında büyük miktarda
veri toplamakta ve depolamaktadır. Bu veriler, birden fazla kaynaktan gelen
yeni verilerin gelmesiyle birlikte, üssel olarak artmaya devam etmektedir.
Şirketlerin ve kuruluşların geleneksel araçlarla büyük miktardaki metin
verilerini depolaması, işlemesi ve analiz etmesi zordur. Bugün, gelişen Tableau
gibi yazılımlar sayesinde bu problemler ortadan kalkmıştır. Bu çalışmanın
amacı; metin madenciliği yöntemi ile Shakespeare eserlerindeki kahramanları ve
olay örgülerini istatistiksel olarak saptamak ve edebiyat alanında çalışanlara
bazı öngörüler sağlamaktır. Bu amaçla çalışmada, Tableau yazılımı kullanılarak
Google BigQuery’nin alt yapısında bulunan Shakespeare veri setine kelime
frekansları, görselleştirme ve kümeleme analiz yöntemi uygulanmıştır. Kümeleme
analizi sonucunda “Hamlet” kelimesinin tüm eserlerin merkezinde yer aldığı ve
Hamlet’in Shakespeare’in en önemli eseri olduğu bulunmuştur. Ayrıca, “Romeo ve
Juliet” eserinde sırasıyla; “Romeo”, “Juliet” ve “Love” en çok kullanılan
kelimeler olarak bulunmuştur. Elde edilen bu bulgulardan eserin ana
karakterlerinin “Romeo” ve “Juliet”, konusunun ise “aşk” olduğu sonucuna
varılmıştır.
Arslan, H., Kaynar, O., & Yüksek, A. G. (2015). Kurumsal Kolektif Süreçler için E-Posta İletilerinden Görev Keşfi ve Gerçek Zamanlı Görev Yönetim Sisteminin Geliştirilmesi. Bilişim Teknolojileri Dergisi, 10(4), 381-388.
Azzalini, A., & Scarpa, B. (2012). Data analysis and data mining: An introduction. OUP USA.
Bose, B. (2018). Techniques and Aplications of Text Mining. https://www.digitalvidya.com/blog/techniques-applications-text-mining/, (Erişim Tarihi: 10.06.2018).
Bozyiğit, F. (2015). Analyzing source code and detecting similarities, M.Sc Thesis, Dokuz Eylül University, Izmir.
Coursehero (2019). Terim frekanı tf bir doküman içerisinde bir. https://www.coursehero.com/file/p14lar0/Terim-Frekans, (Erişim Tarihi: 20.01.2019).
Delibaş, A., (2008). Doğal Dil İşleme İle Türkçe Yazım Hatalarının Denetlenmesi, Yüksek Lisans Tezi, İstanbul Teknik Üniversitesi, İstanbul, Türkiye.
Dinçer, E. (2006). Veri Madenciliğinde K-Means Algoritması ve Tıp Alanında Uygulanması, Yüksek Lisans Tezi, Kocaeli Üniversitesi, Fen Bilimleri Enstitüsü, Kocaeli, 101s.
Dolgun, M. Ö., Özdemir, T. G., & Oğuz, D. (2009). Veri madenciliğiâ nde yapısal olmayan verinin analizi: Metin ve web madenciliği. İstatistikçiler Dergisi: İstatistik ve Aktüerya, 2(2), 48-58.
Evans, S., Lioyd, J., Stoddard, G., Nekeber, J., Samone, M. 2005. Risk Factors For Adverse Drug Events. The Annals of Pharmacotherapy, 39, 1161-1168.
Gaikwad, S. V., Chaugule, A., & Patil, P. (2014). Text mining methods and techniques. International Journal of Computer Applications, 85(17).
Hotho, A., Nürnberger, A., & Paaß, G. (2005, May). A brief survey of text mining. In Ldv Forum (Vol. 20, No. 1, pp. 19-62).
Işık, M. (2006). Bölünmeli kümeleme yöntemleri ile veri madenciliği uygulamaları. Y. Lisans Tezi, Fen Bilimleri Enstitüsü, Marmara Üniversitesi, İstanbul.
İlhan, S., Duru, N., Karagöz, Ş., & Sağır, M. (2008). Metin Madenciliği ile Soru Cevaplama Sistemi. Elektronik ve Bilgisayar Mühendisliği Sempozyumu (ELECO), Bursa, 26-30.
Jain, A. K., Murty, M. N., & Flynni, P. J. (1999). Data clustering: a review. ACM computing surveys (CSUR), 31(3), 264-323.
Kılınç, D., Borandağ, E., Yücalar, F., Tunalı, V., Şimşek, M., & Özçift, A. (2016). KNN algoritması ve r dili ile metin madenciliği kullanılarak bilimsel makale tasnifi. DOI: 10.7240/mufbed.69674
Linguamatics (2018). What is NLP Text Mining?. https://www.linguamatics.com/what-is-text-mining-nlp-machine-learning, (Erişim Tarihi: 20.12.2018).
Mane, S. (2018). What are the application of text mining?. https://www.quora.com/What-are-the-applications-of-text-mining/answer/Sayali-Mane-16, (Erişim Tarihi: 23.04.2018).
Maria, L. (2018). Understanding and Writing your first Text Mining Script with R. https://towardsdatascience.com/understanding-and-writing-your-first-text-mining-script-with-r-c74a7efbe30f, (Erişim Tarihi: 11.01.2018).
Padhy, N., Mishra, D., & Panigrahi, R. (2012). The survey of data mining applications and feature scope. arXiv preprint arXiv:1211.5723.
Pat Reserch (2018). Top Free Software for Text Analysis Text Mining Text Analytics. https://www.predictiveanalyticstoday.com/top-free-software-for-text-analysis-text-mining-text-analytics/, (Erişim Tarihi: 10.12.2018).
Port (2018). An introduction to text mining. https://port.sas.ac.uk/mod/book/view.php?id=554&chapterid=325, (Erişim Tarihi: 22.12.2018).
Rouse, M. (2018). Text mining (text Analytics). https://searchbusinessanalytics.techtarget.com/definition/text-mining, (Erişim Tarihi: 20.12.2018).
Rai, A. (2018). What is Text Mining: Techniques and Applications. https://www.upgrad.com/blog/what-is-text-mining-techniques-and-applications/, (Erişim Tarihi: 13.06.2018).
Seker, S. E., Mert, C., Al-Naami, K., Ozalp, N., & Ayan, U. (2013). Correlation between the economy news and stock market in Turkey. International Journal of Business Intelligence Research (IJBIR), 4(4), 1-21.
Seker, S. E. (2015). Metin Madenciliği (Text Mining). YBS Ansiklopedi, 2(3), 30-32.
Sagayam, R., Sriniyasan, S., & Roshni, S. (2012). A survey of text mining: Retrieval, extraction and indexing techniques. International Journal of Computational Engineering Research, 2(5), 1443.
Tableau (2018). Find Cluster in Data. https://onlinehelp.tableau.com/v2018.3/pro/desktop/en-us/clustering.htm#HowItWorks, (Erişim Tarihi: 25.12.2018).
Talib, R., Hanif, M. K., Ayesha, S., & Fatima, F. (2016). Text mining: techniques, applications and issues. International Journal of Advanced Computer Science and Applications, 7(11), 414-418.
Weiss, S. M., Indurkhya, N., Zhang, T., & Damerau, F. (2010). Text mining: predictive methods for analyzing unstructured information. Springer Science & Business Media.
Williams, J. (2018). 9 Best Applications of Text Data Mining and Analysisis. https://www.promptcloud.com/blog/9-best-examples-of-text-mining-analysis, (Erişim Tarihi: 06.08.2018).
Year 2020,
Volume: 9 Issue: 3, 1343 - 1357, 21.07.2020
Arslan, H., Kaynar, O., & Yüksek, A. G. (2015). Kurumsal Kolektif Süreçler için E-Posta İletilerinden Görev Keşfi ve Gerçek Zamanlı Görev Yönetim Sisteminin Geliştirilmesi. Bilişim Teknolojileri Dergisi, 10(4), 381-388.
Azzalini, A., & Scarpa, B. (2012). Data analysis and data mining: An introduction. OUP USA.
Bose, B. (2018). Techniques and Aplications of Text Mining. https://www.digitalvidya.com/blog/techniques-applications-text-mining/, (Erişim Tarihi: 10.06.2018).
Bozyiğit, F. (2015). Analyzing source code and detecting similarities, M.Sc Thesis, Dokuz Eylül University, Izmir.
Coursehero (2019). Terim frekanı tf bir doküman içerisinde bir. https://www.coursehero.com/file/p14lar0/Terim-Frekans, (Erişim Tarihi: 20.01.2019).
Delibaş, A., (2008). Doğal Dil İşleme İle Türkçe Yazım Hatalarının Denetlenmesi, Yüksek Lisans Tezi, İstanbul Teknik Üniversitesi, İstanbul, Türkiye.
Dinçer, E. (2006). Veri Madenciliğinde K-Means Algoritması ve Tıp Alanında Uygulanması, Yüksek Lisans Tezi, Kocaeli Üniversitesi, Fen Bilimleri Enstitüsü, Kocaeli, 101s.
Dolgun, M. Ö., Özdemir, T. G., & Oğuz, D. (2009). Veri madenciliğiâ nde yapısal olmayan verinin analizi: Metin ve web madenciliği. İstatistikçiler Dergisi: İstatistik ve Aktüerya, 2(2), 48-58.
Evans, S., Lioyd, J., Stoddard, G., Nekeber, J., Samone, M. 2005. Risk Factors For Adverse Drug Events. The Annals of Pharmacotherapy, 39, 1161-1168.
Gaikwad, S. V., Chaugule, A., & Patil, P. (2014). Text mining methods and techniques. International Journal of Computer Applications, 85(17).
Hotho, A., Nürnberger, A., & Paaß, G. (2005, May). A brief survey of text mining. In Ldv Forum (Vol. 20, No. 1, pp. 19-62).
Işık, M. (2006). Bölünmeli kümeleme yöntemleri ile veri madenciliği uygulamaları. Y. Lisans Tezi, Fen Bilimleri Enstitüsü, Marmara Üniversitesi, İstanbul.
İlhan, S., Duru, N., Karagöz, Ş., & Sağır, M. (2008). Metin Madenciliği ile Soru Cevaplama Sistemi. Elektronik ve Bilgisayar Mühendisliği Sempozyumu (ELECO), Bursa, 26-30.
Jain, A. K., Murty, M. N., & Flynni, P. J. (1999). Data clustering: a review. ACM computing surveys (CSUR), 31(3), 264-323.
Kılınç, D., Borandağ, E., Yücalar, F., Tunalı, V., Şimşek, M., & Özçift, A. (2016). KNN algoritması ve r dili ile metin madenciliği kullanılarak bilimsel makale tasnifi. DOI: 10.7240/mufbed.69674
Linguamatics (2018). What is NLP Text Mining?. https://www.linguamatics.com/what-is-text-mining-nlp-machine-learning, (Erişim Tarihi: 20.12.2018).
Mane, S. (2018). What are the application of text mining?. https://www.quora.com/What-are-the-applications-of-text-mining/answer/Sayali-Mane-16, (Erişim Tarihi: 23.04.2018).
Maria, L. (2018). Understanding and Writing your first Text Mining Script with R. https://towardsdatascience.com/understanding-and-writing-your-first-text-mining-script-with-r-c74a7efbe30f, (Erişim Tarihi: 11.01.2018).
Padhy, N., Mishra, D., & Panigrahi, R. (2012). The survey of data mining applications and feature scope. arXiv preprint arXiv:1211.5723.
Pat Reserch (2018). Top Free Software for Text Analysis Text Mining Text Analytics. https://www.predictiveanalyticstoday.com/top-free-software-for-text-analysis-text-mining-text-analytics/, (Erişim Tarihi: 10.12.2018).
Port (2018). An introduction to text mining. https://port.sas.ac.uk/mod/book/view.php?id=554&chapterid=325, (Erişim Tarihi: 22.12.2018).
Rouse, M. (2018). Text mining (text Analytics). https://searchbusinessanalytics.techtarget.com/definition/text-mining, (Erişim Tarihi: 20.12.2018).
Rai, A. (2018). What is Text Mining: Techniques and Applications. https://www.upgrad.com/blog/what-is-text-mining-techniques-and-applications/, (Erişim Tarihi: 13.06.2018).
Seker, S. E., Mert, C., Al-Naami, K., Ozalp, N., & Ayan, U. (2013). Correlation between the economy news and stock market in Turkey. International Journal of Business Intelligence Research (IJBIR), 4(4), 1-21.
Seker, S. E. (2015). Metin Madenciliği (Text Mining). YBS Ansiklopedi, 2(3), 30-32.
Sagayam, R., Sriniyasan, S., & Roshni, S. (2012). A survey of text mining: Retrieval, extraction and indexing techniques. International Journal of Computational Engineering Research, 2(5), 1443.
Tableau (2018). Find Cluster in Data. https://onlinehelp.tableau.com/v2018.3/pro/desktop/en-us/clustering.htm#HowItWorks, (Erişim Tarihi: 25.12.2018).
Talib, R., Hanif, M. K., Ayesha, S., & Fatima, F. (2016). Text mining: techniques, applications and issues. International Journal of Advanced Computer Science and Applications, 7(11), 414-418.
Weiss, S. M., Indurkhya, N., Zhang, T., & Damerau, F. (2010). Text mining: predictive methods for analyzing unstructured information. Springer Science & Business Media.
Williams, J. (2018). 9 Best Applications of Text Data Mining and Analysisis. https://www.promptcloud.com/blog/9-best-examples-of-text-mining-analysis, (Erişim Tarihi: 06.08.2018).
Çelik, S. (2020). Metin Madenciliği ile Shakespeare Külliyatının İncelenmesi. MANAS Sosyal Araştırmalar Dergisi, 9(3), 1343-1357. https://doi.org/10.33206/mjss.561919
AMA
Çelik S. Metin Madenciliği ile Shakespeare Külliyatının İncelenmesi. MJSS. July 2020;9(3):1343-1357. doi:10.33206/mjss.561919
Chicago
Çelik, Sadullah. “Metin Madenciliği Ile Shakespeare Külliyatının İncelenmesi”. MANAS Sosyal Araştırmalar Dergisi 9, no. 3 (July 2020): 1343-57. https://doi.org/10.33206/mjss.561919.
EndNote
Çelik S (July 1, 2020) Metin Madenciliği ile Shakespeare Külliyatının İncelenmesi. MANAS Sosyal Araştırmalar Dergisi 9 3 1343–1357.
IEEE
S. Çelik, “Metin Madenciliği ile Shakespeare Külliyatının İncelenmesi”, MJSS, vol. 9, no. 3, pp. 1343–1357, 2020, doi: 10.33206/mjss.561919.
ISNAD
Çelik, Sadullah. “Metin Madenciliği Ile Shakespeare Külliyatının İncelenmesi”. MANAS Sosyal Araştırmalar Dergisi 9/3 (July 2020), 1343-1357. https://doi.org/10.33206/mjss.561919.
JAMA
Çelik S. Metin Madenciliği ile Shakespeare Külliyatının İncelenmesi. MJSS. 2020;9:1343–1357.
MLA
Çelik, Sadullah. “Metin Madenciliği Ile Shakespeare Külliyatının İncelenmesi”. MANAS Sosyal Araştırmalar Dergisi, vol. 9, no. 3, 2020, pp. 1343-57, doi:10.33206/mjss.561919.
Vancouver
Çelik S. Metin Madenciliği ile Shakespeare Külliyatının İncelenmesi. MJSS. 2020;9(3):1343-57.