EN
TR
TWİTTER VERİLERİNDEN DOĞAL DİL İŞLEME VE MAKİNE ÖĞRENMESİ İLE HASTALIK TESPİTİ
Abstract
Bu çalışmada twitterdaki kullanıcıların yazmış oldukları mesajların hastalık konulu olup olmadığı ve hastalık türleri tespit edilmiştir. Bu amaçla gözetimli ve gözetimsiz makine öğrenmesi algoritmaları, TF-IDF ve BOW yöntemleri ile çıkarılan özellikler ile denenmiş ve karşılaştırmalar yapılmıştır. Veriler Python betikleri ile twitter üzerinden toplanmıştır. Algoritmaları uygulamak için Python için geliştirilmiş Scikit-Learn kütüphanesi kullanılmıştır. Gözetimsiz olarak verilerin kümelenmesinde %68.60’lık bir başarı elde edilirken, gözetimli algoritmalar ile yapılan sınıflandırmalarda %97.48’lik başarı oranına ulaşılmıştır.
Keywords
References
- Aloise, D., Deshpande, A., Hansen, P., Popat, P., 2009, "NP-hardness of Euclidean sum-of-square clustering", Machine learning, Cilt 75, Sayı 2, ss. 245-248.
- Ambert, K. H., Cohen, A.M., 2009, “A System for Classifying Disease Comorbidity Status from Medical Discharge Summaries Using Automated Hotspot and Negated Concept Detection”, Journal of the American Medical Informatics Association, Cilt 16, Sayı 4, ss. 590–595.
- Acherkar, H., Gandhe, A., Lazarus, R., Yu, S., Liu, B., 2011, “Predicting Flu Trends using Twitter Data”, 2011 IEEE Conference on Computer Communications Workshops (INFOCOM WKSHPS), Shanghai, China, 702-706.
- Cavnar, W. B., Trenkle, J. M., 1994, "N-gram-based text categorization.", Proceedings of SDAIR-94, 3rd annual symposium on document analysis and information retrieval, Las Vegas, Nevada, A.B.D., 161- 175.
- Conmay, M., Hu, M., Chapman W.W., 2019, “Recent Advances in Using Natural Language Processing to Address Public Health Research Questions Using Social Media and ConsumerGenerated Data”, Yearbook of Medical Informatics, Cilt 28, Sayı 1, ss. 208-217.
- Dai, X., Bikdash, M., 2015, “Hybrid Classification for Tweets Related to Infection with Influenza”, Proceedings of the IEEE SoutheastCon 2015, Fort Lauderdale, Florida, 1-5.
- Dai, X., Bikdash, M., 2016, “Distance-based Outliers Method for Detecting Disease Outbreaks using Social Media”, Proceedings of the IEEE SoutheastCon 2015, Norfolk, VA, USA, 1-8.
- Edo-Osagie, O., Iglesia, B.D.L., Lake, I., Edeghere, O., 2020, “A scoping review of the use of Twitter for public health research”, Computers in Biology and Medicine, Available Online, 103770, doi: 10.1016/j.compbiomed.2020.103770.
Details
Primary Language
Turkish
Subjects
Engineering
Journal Section
Research Article
Publication Date
December 1, 2020
Submission Date
November 23, 2019
Acceptance Date
July 22, 2020
Published in Issue
Year 2020 Volume: 8 Number: 4
APA
Öztürk, A., Durak, Ü., & Badıllı, F. (2020). TWİTTER VERİLERİNDEN DOĞAL DİL İŞLEME VE MAKİNE ÖĞRENMESİ İLE HASTALIK TESPİTİ. Konya Journal of Engineering Sciences, 8(4), 839-852. https://doi.org/10.36306/konjes.650150
AMA
1.Öztürk A, Durak Ü, Badıllı F. TWİTTER VERİLERİNDEN DOĞAL DİL İŞLEME VE MAKİNE ÖĞRENMESİ İLE HASTALIK TESPİTİ. KONJES. 2020;8(4):839-852. doi:10.36306/konjes.650150
Chicago
Öztürk, Ali, Üsame Durak, and Fatma Badıllı. 2020. “TWİTTER VERİLERİNDEN DOĞAL DİL İŞLEME VE MAKİNE ÖĞRENMESİ İLE HASTALIK TESPİTİ”. Konya Journal of Engineering Sciences 8 (4): 839-52. https://doi.org/10.36306/konjes.650150.
EndNote
Öztürk A, Durak Ü, Badıllı F (December 1, 2020) TWİTTER VERİLERİNDEN DOĞAL DİL İŞLEME VE MAKİNE ÖĞRENMESİ İLE HASTALIK TESPİTİ. Konya Journal of Engineering Sciences 8 4 839–852.
IEEE
[1]A. Öztürk, Ü. Durak, and F. Badıllı, “TWİTTER VERİLERİNDEN DOĞAL DİL İŞLEME VE MAKİNE ÖĞRENMESİ İLE HASTALIK TESPİTİ”, KONJES, vol. 8, no. 4, pp. 839–852, Dec. 2020, doi: 10.36306/konjes.650150.
ISNAD
Öztürk, Ali - Durak, Üsame - Badıllı, Fatma. “TWİTTER VERİLERİNDEN DOĞAL DİL İŞLEME VE MAKİNE ÖĞRENMESİ İLE HASTALIK TESPİTİ”. Konya Journal of Engineering Sciences 8/4 (December 1, 2020): 839-852. https://doi.org/10.36306/konjes.650150.
JAMA
1.Öztürk A, Durak Ü, Badıllı F. TWİTTER VERİLERİNDEN DOĞAL DİL İŞLEME VE MAKİNE ÖĞRENMESİ İLE HASTALIK TESPİTİ. KONJES. 2020;8:839–852.
MLA
Öztürk, Ali, et al. “TWİTTER VERİLERİNDEN DOĞAL DİL İŞLEME VE MAKİNE ÖĞRENMESİ İLE HASTALIK TESPİTİ”. Konya Journal of Engineering Sciences, vol. 8, no. 4, Dec. 2020, pp. 839-52, doi:10.36306/konjes.650150.
Vancouver
1.Ali Öztürk, Üsame Durak, Fatma Badıllı. TWİTTER VERİLERİNDEN DOĞAL DİL İŞLEME VE MAKİNE ÖĞRENMESİ İLE HASTALIK TESPİTİ. KONJES. 2020 Dec. 1;8(4):839-52. doi:10.36306/konjes.650150
Cited By
Genetik Algoritma Yaklaşımıyla Öznitelik Seçimi Kullanılarak Makine Öğrenmesi Algoritmaları ile Kalp Hastalığı Tahmini
Journal of Scientific Technology and Engineering Research
https://doi.org/10.53525/jster.1005934Netflix verileri üzerinde TF-IDF algoritması ve Kosinüs benzerliği ile bir İçerik Öneri Sistemi Uygulaması
AJIT-e Online Academic Journal of Information Technology
https://doi.org/10.5824/ajite.2022.01.002.xATMOSFERİK PARTİKÜL MADDELERİN MAKİNE ÖĞRENMESİ İLE TAHMİNİ: BEŞİKTAŞ, İSTANBUL ÖRNEĞİ
Konya Journal of Engineering Sciences
https://doi.org/10.36306/konjes.1082866İlkokul Türkçe Dersi Okuma Metinlerindeki Kelime, Harf ve Hece Sıklıklarına Karşılaştırmalı Bir Bakış
Ana Dili Eğitimi Dergisi
https://doi.org/10.16916/aded.1168257SENTIMENT CLASSIFICATION ON TURKISH TWEETS ABOUT COVID-19 USING LSTM NETWORK
Konya Journal of Engineering Sciences
https://doi.org/10.36306/konjes.1173939