TY - JOUR T1 - Türkçe Tweetler Üzerinde Otomatik Soru Tespiti TT - Automatic Question Identification on Turkish Tweets AU - Mayda, İslam PY - 2018 DA - December JF - Veri Bilimi JO - Data Sci. J. PB - Murat GÖK WT - DergiPark SN - 2667-582X SP - 1 EP - 6 VL - 1 IS - 1 LA - tr AB - Bu çalışmada Twitter'da paylaşılan Türkçe yazılmış tweetlerden, içindesoru geçenleri kural tabanlı yaklaşımla tespit edilmeye çalışılmıştır. Veriseti olarak rastgele örneklenen tweetler yerine belirli bir etiket ilepaylaşılan tweetler kullanılmıştır. Bunun sebebi, bu çalışmada belirli birodağa yönelik sorulan soruların tespitinin amaçlanmış olmasıdır. Deneyler için,bir televizyon kanalında canlı olarak yayınlanan programda tarihi bir konukonuşulurken izleyicilerin sorularıyla programa katkıda bulunması amacıylaaçılan etiketle paylaşılan 354 tweet toplanmıştır. Bu tweetlerdeki yazımhatalarını düzeltmede Zemberek kütüphanesinden yararlanılmıştır. Daha sonraTürkçe soru cümlesi yapısına göre, kesinlik değerini veya duyarlılık değeriniyüksek tutmayı amaçlayan 3 farklı basit kural tanımlanmış ve her biri ayrıyöntem olarak deneylerde uygulanmıştır. Deneyler sonucunda %100 kesinlik,%96,48 duyarlılık ve 0.929 F-skoru değerleri en başarılı performanslar olarakkaydedilmiştir. KW - Twitter KW - Türkçe tweetler KW - Soru tespiti N2 - In this work, it was tried to identify which areincludes question from the tweets written in Turkish shared in Twitter, with arule-based approach. As a data set, tweets that are shared with a certainhashtag are used instead of randomly sampled tweets. The reason for this, it isaimed to identify the questions asked for a specific focus in this study. Forthe experiments, 354 tweets were collected, shared with the hashtag that wascreated in order to contribute of the audience to the program by asking thequestions while a historical topic was being spoken in the program broadcastlive on a television channel. The Zemberek library has been used to fix typosin these tweets. Then, according to the Turkish question sentence structure, 3simple rules are defined aiming at keeping the precision value or thesensitivity value high and each one is applied as a separate method. As aresult of experiments, 100% precision, 96.48% sensitivity and 0.929 F-scorevalues were recorded as the most successful performances. CR - Statista, “Number of monthly active Twitter users worldwide from 1st quarter 2010 to 3rd quarter 2017 (in millions)” www.statista.com. [Online]. Available: https://www.statista.com/statistics/282087/number-of-monthly-active-twitter-users/, 2017. CR - M. Efron ve M. Winget, “Questions are content: a taxonomy of questions in a microblogging environment”, Proc. of ASIST ’10, 2010. CR - B. Li, X. Si, M. R. Lyu, I. King ve E. Y. Chang, “Question Identification on Twitter”, Proceedings of the 20th ACM International Conference on Information and Knowledge Management, New York, USA, 2011. CR - Z. B. Özger ve B. Diri, “Sınıflandırma Tabanlı Türkçe Soru Algılama”, Akıllı Sistemlerde Yenilikler ve Uygulamaları, İzmir, Türkiye, 2014. CR - C. Cengiz ve B. Diri, “Türkçe Tweetlerden Soru İfadelerini Bulmak”, Sinyal İşleme ve Uygulamaları Kurultayı, Türkiye, Nisan 2013. CR - Google Code Archive, https://code.google.com/archive/p/zemberek/, 2017. UR - https://dergipark.org.tr/tr/pub/veri/article/489775 L1 - https://dergipark.org.tr/tr/download/article-file/605454 ER -