Research Article
BibTex RIS Cite

Kanser hastalığı ile ilgili paylaşımlar için Dirichlet ayrımı ile gizli konu modelleme

Year 2021, Volume: 36 Issue: 4, 2183 - 2196, 02.09.2021
https://doi.org/10.17341/gazimmfd.734730

Abstract

Sosyal medya ortamlarında, kullanıcılar yaşadıkları olaylar ile ilgili edindikleri tecrübeleri paylaşmaktadır. Kişiler başlarından geçen bir olayı, yeni gördükleri bir şehri, okudukları kitabı vb. paylaşarak aynı belirli konular hakkında diğer kişilere deneyimlerini aktarmaktadır. Sosyal medya kullanan bireylerin konuştuğu konulardan biri de sağlık problemleri ve bu konudaki deneyimlerin paylaşılmasıdır. Sağlık problemi yaşayan bazı bireyler, geçirdikleri hastalıkları, gördüğü tedavileri ve sonuçlarını, her bir evresinde kazandıkları tecrübeleri sosyal ortamlarda yazarak paylaşmaktadır. Bu paylaşımlar gerek bilgilendirici gerekse hastalıkla mücadelede moral/motivasyon için diğer hastalar açısından önem arz etmektedir. Paylaşım sayısının fazla olması, hastalıkların çeşitliği ve veri miktarının büyüklüğü nedeniyle insan tarafından manuel olarak yorumlanması imkânsız hale gelmektedir. Bu çalışmada, Reddit sosyal platformu üzerinden, kanser hastalığı ile ilgili paylaşımlar toplanarak bu veriler üzerinde çalışılmıştır. Bu paylaşımlar üzerinden yapay zekâ tabanlı konu modelleme algoritmalarından “Gizli Dirichlet Ayrımı (GDA)” algoritması ile konuşulan başlıca konu başlıkları bulunmuştur. Konu başlıklarının konuşulan konu ile ilişkisi incelenmiş ve içerik analizi yapılmıştır. Kanser hastalığı ile ilgili paylaşımlar içerisinde en fazla konuşulan içeriklerin belirlenmesi hedeflenmiştir. Ayrıca t-SNE tekniği kullanılarak konuların birbiri arasındaki ilişkisi incelenmiştir. GDA algoritması ile modelleme sonucunda elde edilen konu başlıklarında bulunan kelimelerin yapılan tutarlılık testinde uyumlu olduğu görülmüştür.

References

  • Bhat M.R., Kundroo M.A., Tarray T.A., Agarwal B., Deep LDA: A new way to topic model, J. Inf. Optim. Sci., pp. 1–12, 2019
  • Alexa.com, Alexa Top 500 Global Sites, . http://alexa.com/topsites/, 2019. Erişim Tarihi 25 Ekim 2019
  • Blei D.M., Ng A.Y., Jordan M.I., Latent Dirichlet allocation, J. Mach. Learn. Res., 2003.
  • Foresee D.F., Hagan M.T., Gauss-Newton approximation to Bayesian learning, in Proceedings of International Conference on Neural Networks (ICNN ’97), vol. 3, pp. 1930–1935, 1997.
  • Okon E., Rachakonda V., Hong H.J., Callison-Burch C., Lipoff J., Natural Language Processing of Reddit Data to Evaluate Dermatology Patient Experiences and Therapeutics, J. Am. Acad. Dermatol., Jul. 2019.
  • Ding S., Li Z., Liu X., Huang H., Yang S., Diabetic complication prediction using a similarity-enhanced latent Dirichlet allocation model, Inf. Sci. (Ny)., vol. 499, pp. 12–24, 2019.
  • Chen C., Ren J., Forum latent Dirichlet allocation for user interest discovery, Knowledge-Based Syst., vol. 126, pp. 1–7, 2017.
  • Bastani K., Namavari H., Shaffer J., Latent Dirichlet allocation (LDA) for topic modeling of the CFPB consumer complaints, Expert Syst. Appl., vol. 127, pp. 256–271, 2019.
  • Wang W., Feng F., Dai W., Topic analysis of çevrimiçi reviews for two competitive products using latent Dirichlet allocation, Electron. Commer. Res. Appl., vol. 29, pp. 142–156, 2018.
  • Hagen L., Content analysis of e-petitions with topic modeling: How to train and evaluate LDA models?, Inf. Process. Manag., vol. 54, no. 6, pp. 1292–1307, 2018.
  • Griffiths T.L., Steyvers M., Finding scientific topics, Proc. Natl. Acad. Sci., vol. 101, no. Supplement 1, pp. 5228–5235, 2004.
  • Wang Y., Agichtein E., Benzi M., TM-LDA, in Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining - KDD '12, p. 123, 2012.
  • Xu Z., Ru L., Xiang L., Yang Q., Discovering User Interest on Twitter with a Modified Author-Topic Model, in 2011 IEEE/WIC/ACM International Conferences on Web Intelligence and Intelligent Agent Technology, pp. 422–429, 2011.
  • Xu H, Zhang F.,Wang W., Implicit feature identification in Chinese reviews using explicit topic mining model, Knowledge-Based Syst., vol. 76, pp. 166–175, 2015.
  • Lu Y., Mei Q., Zhai C., Investigating task performance of probabilistic topic models: an empirical study of PLSA and LDA, Inf. Retr. Boston., vol. 14, no. 2, pp. 178–203, 2011.
  • Blei D.M., Probabilistic topic models, Commun. ACM, vol. 55, no. 4, p. 77, 2012.
  • Landauer T.K., Dutnais S.T., A solution to platos problem: The latent semantic analysis theory of acquisition, induction, and representation of knowledge, Psychol. Rev., pp. 211–240, 1997.
  • Lee D.D., Seung H.S., Algorithms for non-negative matrix factorization, NIPS, pp. 556–562, 2001.
  • Stevens K., Kegelmeyer P., Andrzejewski D., Buttler D., Exploring Topic Coherence over Many Models and Many Topics, Assoc. Comput. Linguist., vol. Proceeding, pp. 952–961, 2012.
  • Reddit, Reddit.com, 2005. Erişim tarihi Ocak 10, 2020.
  • PRAW, PRAW, 2017, https://praw.readthedocs.io/en/latest/. Erişim Tarihi Ocak 10, 2020.
  • NLTK, NLTK, 2019, https://nltk.org. Erişim Tarihi Ocak 10,2020.
  • Gensim, Gensim, 2009, https://radimrehurek.com/gensim/. Erişim Tarihi Şubat 4 2020 .
  • Maaten L., Hinton G., Visualizing Data using t-SNE, J. Mach. Learn. Res., vol. 9, pp. 2579–2605, 2008.
  • Sievert C., Shirley K., LDAvis: A method for visualizing and interpreting topics, in Proceedings of the Workshop on Interactive Language Learning, Visualization, and Interfaces, pp. 63–70, 2014.
  • Hidayatullah A.F., Ma’arif M.R., Road traffic topic modeling on Twitter using latent dirichlet allocation, in 2017 International Conference on Sustainable Information Engineering and Technology (SIET), pp. 47–52, 2017.
  • Chang J., Gerrish S., Wang C., Blei D.M., Reading Tea Leaves: How Humans Interpret Topic Models, in Advances in Neural Information Processing Systems 22, pp. 288–296, 2009.
  • Roder M., Both A., Hinneburg A., Exploring the Space of Topic ¨ Coherence Measures, in Proceedings of the Eighth ACM International Conference on Web Search and Data Mining - WSDM ’15. New York, USA: ACM Press, pp. 399–408, 2015.
Year 2021, Volume: 36 Issue: 4, 2183 - 2196, 02.09.2021
https://doi.org/10.17341/gazimmfd.734730

Abstract

References

  • Bhat M.R., Kundroo M.A., Tarray T.A., Agarwal B., Deep LDA: A new way to topic model, J. Inf. Optim. Sci., pp. 1–12, 2019
  • Alexa.com, Alexa Top 500 Global Sites, . http://alexa.com/topsites/, 2019. Erişim Tarihi 25 Ekim 2019
  • Blei D.M., Ng A.Y., Jordan M.I., Latent Dirichlet allocation, J. Mach. Learn. Res., 2003.
  • Foresee D.F., Hagan M.T., Gauss-Newton approximation to Bayesian learning, in Proceedings of International Conference on Neural Networks (ICNN ’97), vol. 3, pp. 1930–1935, 1997.
  • Okon E., Rachakonda V., Hong H.J., Callison-Burch C., Lipoff J., Natural Language Processing of Reddit Data to Evaluate Dermatology Patient Experiences and Therapeutics, J. Am. Acad. Dermatol., Jul. 2019.
  • Ding S., Li Z., Liu X., Huang H., Yang S., Diabetic complication prediction using a similarity-enhanced latent Dirichlet allocation model, Inf. Sci. (Ny)., vol. 499, pp. 12–24, 2019.
  • Chen C., Ren J., Forum latent Dirichlet allocation for user interest discovery, Knowledge-Based Syst., vol. 126, pp. 1–7, 2017.
  • Bastani K., Namavari H., Shaffer J., Latent Dirichlet allocation (LDA) for topic modeling of the CFPB consumer complaints, Expert Syst. Appl., vol. 127, pp. 256–271, 2019.
  • Wang W., Feng F., Dai W., Topic analysis of çevrimiçi reviews for two competitive products using latent Dirichlet allocation, Electron. Commer. Res. Appl., vol. 29, pp. 142–156, 2018.
  • Hagen L., Content analysis of e-petitions with topic modeling: How to train and evaluate LDA models?, Inf. Process. Manag., vol. 54, no. 6, pp. 1292–1307, 2018.
  • Griffiths T.L., Steyvers M., Finding scientific topics, Proc. Natl. Acad. Sci., vol. 101, no. Supplement 1, pp. 5228–5235, 2004.
  • Wang Y., Agichtein E., Benzi M., TM-LDA, in Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining - KDD '12, p. 123, 2012.
  • Xu Z., Ru L., Xiang L., Yang Q., Discovering User Interest on Twitter with a Modified Author-Topic Model, in 2011 IEEE/WIC/ACM International Conferences on Web Intelligence and Intelligent Agent Technology, pp. 422–429, 2011.
  • Xu H, Zhang F.,Wang W., Implicit feature identification in Chinese reviews using explicit topic mining model, Knowledge-Based Syst., vol. 76, pp. 166–175, 2015.
  • Lu Y., Mei Q., Zhai C., Investigating task performance of probabilistic topic models: an empirical study of PLSA and LDA, Inf. Retr. Boston., vol. 14, no. 2, pp. 178–203, 2011.
  • Blei D.M., Probabilistic topic models, Commun. ACM, vol. 55, no. 4, p. 77, 2012.
  • Landauer T.K., Dutnais S.T., A solution to platos problem: The latent semantic analysis theory of acquisition, induction, and representation of knowledge, Psychol. Rev., pp. 211–240, 1997.
  • Lee D.D., Seung H.S., Algorithms for non-negative matrix factorization, NIPS, pp. 556–562, 2001.
  • Stevens K., Kegelmeyer P., Andrzejewski D., Buttler D., Exploring Topic Coherence over Many Models and Many Topics, Assoc. Comput. Linguist., vol. Proceeding, pp. 952–961, 2012.
  • Reddit, Reddit.com, 2005. Erişim tarihi Ocak 10, 2020.
  • PRAW, PRAW, 2017, https://praw.readthedocs.io/en/latest/. Erişim Tarihi Ocak 10, 2020.
  • NLTK, NLTK, 2019, https://nltk.org. Erişim Tarihi Ocak 10,2020.
  • Gensim, Gensim, 2009, https://radimrehurek.com/gensim/. Erişim Tarihi Şubat 4 2020 .
  • Maaten L., Hinton G., Visualizing Data using t-SNE, J. Mach. Learn. Res., vol. 9, pp. 2579–2605, 2008.
  • Sievert C., Shirley K., LDAvis: A method for visualizing and interpreting topics, in Proceedings of the Workshop on Interactive Language Learning, Visualization, and Interfaces, pp. 63–70, 2014.
  • Hidayatullah A.F., Ma’arif M.R., Road traffic topic modeling on Twitter using latent dirichlet allocation, in 2017 International Conference on Sustainable Information Engineering and Technology (SIET), pp. 47–52, 2017.
  • Chang J., Gerrish S., Wang C., Blei D.M., Reading Tea Leaves: How Humans Interpret Topic Models, in Advances in Neural Information Processing Systems 22, pp. 288–296, 2009.
  • Roder M., Both A., Hinneburg A., Exploring the Space of Topic ¨ Coherence Measures, in Proceedings of the Eighth ACM International Conference on Web Search and Data Mining - WSDM ’15. New York, USA: ACM Press, pp. 399–408, 2015.
There are 28 citations in total.

Details

Primary Language Turkish
Subjects Engineering
Journal Section Makaleler
Authors

Volkan Altıntaş 0000-0002-1560-9017

Mehmet Albayrak 0000-0002-7089-122X

Kamil Topal 0000-0002-0266-7365

Publication Date September 2, 2021
Submission Date May 9, 2020
Acceptance Date April 14, 2021
Published in Issue Year 2021 Volume: 36 Issue: 4

Cite

APA Altıntaş, V., Albayrak, M., & Topal, K. (2021). Kanser hastalığı ile ilgili paylaşımlar için Dirichlet ayrımı ile gizli konu modelleme. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 36(4), 2183-2196. https://doi.org/10.17341/gazimmfd.734730
AMA Altıntaş V, Albayrak M, Topal K. Kanser hastalığı ile ilgili paylaşımlar için Dirichlet ayrımı ile gizli konu modelleme. GUMMFD. September 2021;36(4):2183-2196. doi:10.17341/gazimmfd.734730
Chicago Altıntaş, Volkan, Mehmet Albayrak, and Kamil Topal. “Kanser hastalığı Ile Ilgili paylaşımlar için Dirichlet ayrımı Ile Gizli Konu Modelleme”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 36, no. 4 (September 2021): 2183-96. https://doi.org/10.17341/gazimmfd.734730.
EndNote Altıntaş V, Albayrak M, Topal K (September 1, 2021) Kanser hastalığı ile ilgili paylaşımlar için Dirichlet ayrımı ile gizli konu modelleme. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 36 4 2183–2196.
IEEE V. Altıntaş, M. Albayrak, and K. Topal, “Kanser hastalığı ile ilgili paylaşımlar için Dirichlet ayrımı ile gizli konu modelleme”, GUMMFD, vol. 36, no. 4, pp. 2183–2196, 2021, doi: 10.17341/gazimmfd.734730.
ISNAD Altıntaş, Volkan et al. “Kanser hastalığı Ile Ilgili paylaşımlar için Dirichlet ayrımı Ile Gizli Konu Modelleme”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 36/4 (September 2021), 2183-2196. https://doi.org/10.17341/gazimmfd.734730.
JAMA Altıntaş V, Albayrak M, Topal K. Kanser hastalığı ile ilgili paylaşımlar için Dirichlet ayrımı ile gizli konu modelleme. GUMMFD. 2021;36:2183–2196.
MLA Altıntaş, Volkan et al. “Kanser hastalığı Ile Ilgili paylaşımlar için Dirichlet ayrımı Ile Gizli Konu Modelleme”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, vol. 36, no. 4, 2021, pp. 2183-96, doi:10.17341/gazimmfd.734730.
Vancouver Altıntaş V, Albayrak M, Topal K. Kanser hastalığı ile ilgili paylaşımlar için Dirichlet ayrımı ile gizli konu modelleme. GUMMFD. 2021;36(4):2183-96.