Araştırma Makalesi
BibTex RIS Kaynak Göster

An Evaluation of Abstracts Presented in the International Congresses which Includes “Data Science” Expression in Title Using Text Mining Method

Yıl 2022, Cilt: 4 Sayı: 1, 1 - 21, 30.06.2022
https://doi.org/10.51541/nicel.1075225

Öz

By the emergence of the concept of Data Science, the data-based decision-making processes and the methods used in these processes has enabled the development of algorithms by using the opportunities provided by information technologies as well as classical statistical methods, like machine learning, deep learning, etc. At the present time, understanding the data, revealing the patterns, modeling the data in a functional way and producing the results have gained importance for a rapidly increasing data structure rather than obtaining the data. For this reason, the concept of “Data Science” caused a change in the name and content of statistical congresses. The purpose of this research is to utilize text mining to examine the concept of "Data Science" in statistics conferences. Examining the summary contents of the presentations in these congresses and published in the proceedings and determining their tendencies were examined in terms of text mining methods, which have an important place in data science. This study reveals the trends in the contents of the abstracts in congresses with the concept of data science.

Kaynakça

  • Albayrak, A. (2020), Doğal dil işleme teknikleri kullanılarak disiplinler arası lisansüstü ders içeriği hazırlanması, Bilişim Teknolojileri Dergisi, 13(4), 373-383.
  • Başkaya, F. ve Aydın, İ. (2017), Haber metinlerinin farklı metin madenciliği yöntemleriyle sınıflandırılması, 2017 International Artificial Intelligence and Data Processing Symposium (IDAP), Malatya, Türkiye.
  • Cao, L. (2017), Data science: A comprehensive overview, ACM Computing Surveys, 50(3), 1-42.
  • Dang, S. and Ahmad, P. H. (2014), Text Mining: Techniques and its application, IJETI International Journal of Engineering & Technology Innovations, 1(4), 22-25.
  • Davenport, T. H. and Patil, D. J. (2012). Data Scientist: The sexiest job of the 21st Century, Harvard Business Review, 90(10), 70–76.
  • Dhar, V. (2013), Data science and prediction, Communications of the ACM, 56(12), 64-73.
  • Feinerer, I., Hornik K. and Meyer, D. (2008), Text Mining Infrastructure in R, Journal of Statistical Software, 25(5), 1–54.
  • Gök, M. (2022), Veri Bilimi, https://dergipark.org.tr/en/pub/veri. Erişim Tarihi: 14. 02.2022.
  • Gökalp, M. O., Kayabay, K., Çoban, S., Yandık, Y. B. ve Eren, P. E. (2018), Büyük veri çağında ı̇şletmelerde veri bilimi, 5. International Management Information Systems Conference (IMISC), 24-26 Kasım 2018, Ankara, Türkiye.
  • Gupta V. and Lehal, G. S. (2009), A survey of text mining techniques and applications, Journal of Emerging Technologies in Web Intelligence, 1(1), 60-76.
  • Gümüşsu, E. ve Murat, N. (2019), ‘Tamam’ ve ‘Devam’ etiketleriyle atılan tweetler ile cumhur ve millet ittifakı grupları arasındaki ilişkinin incelenmesi, Bilişim Teknolojileri Dergisi, 12(4), 287-298.
  • Hayashi, C. (1998), What is data science? Fundamental concepts and a heuristic example, Hayashi C., Yajima K., Bock HH., Ohsumi N., Tanaka Y., Baba Y. (eds), Data Science, Classification, and Related Methods. Studies in Classification, Data Analysis, and Knowledge Organization, 40-51, Springer, Tokyo.
  • Kauermann, G. and Seidl, T. (2018), Data science: A proposal for a curriculum, International Journal of Data Science and Analytics, 6(3), 195–199.
  • Kılıç, G. G., Turanli, M. and Özden, Ü. H. (2019), Data mining and statistics in data science, International Social Sciences Studies Journal, 5(30), 960–968.
  • Muthukadan, B. (2022), Selenium Python documentation. https://selenium-python.readthedocs.io/installation.html. Erişim Tarihi: 14 Şubat 2022.
  • Press, G. (2022), A Very Short History of Data Science, https://www.forbes.com/sites/gilpress/2013/05/28/a-very-short-history-of-data-science/?sh=56de23555cfc. Erişim Tarihi: 14.02.2022.
  • Python Software Foundation (2022), Python Language Reference, version 3.8.3, http://www.python.org. Erişim Tarihi: 14.02.2022.
  • R Core Team (2022), R: A language and environment for statistical computing, https://www.R-project.org/. Erişim Tarihi: 14.02.2022.
  • Radovilsky, Z., Hegde, V., Acharya, A. and Uma, U. (2018), Skills requirements of business data analytics and data science jobs: A comparative analysis, Journal of Supply Chain and Operations Management, 16(1), 82-101.
  • Richardson, L. (2022), Beautiful soup documentation, Python library version 4.10.0, https://www.crummy.com/software/BeautifulSoup/bs4/doc/. Erişim Tarihi: 14.02.2022.
  • Silge, J. and Robinson, D. (2016), tidytext: Text mining and analysis using tidy data principles in R, JOSS, 1(3), 1-3.
  • Sütçü, C. ve Aytekin, Ç. (2018), Veri Bilimi, 1. baskı, (137-140), Paloma Yayınevi, İstanbul, Türkiye.
  • Takcı H. ve Baktır, N. (2018), Büyük veri yaklaşımıyla birden çok bilgi erişim merkezinin kolektif kullanımı, Bilişim Teknolojileri Dergisi, 11(2), 123-129.
  • Temmuz Gürcanok, O. (2020), E-Ticaret satış verileri üzerinde bir veri bilimi vaka çalışması, Yüksek Lisans Tezi, Maltepe Üniversitesi, İstanbul, Türkiye.
  • Weihs, C. and Ickstadt, K. (2018), Data science: The impact of statistics, International Journal of Data Science and Analytics, 6(3), 189–194.
  • Wickham, H (2022), stringr: Simple, Consistent Wrappers for Common String Operations Package. R package version 1.4.0, https://cran.r-project.org/web/packages/stringr/index.html. Erişim Tarihi: 14.02.2022.
  • Wickham, H., Chang, W., Henry, L., Pedersen, T. L., Takahashi, K., Wilke, C., Woo, K., Yutani, H., Dunnington, D. and RStudio (2022). ggplot2: Create Elegant Data Visualisations Using the Grammar of Graphics. R package version 3.3.5, https://cran.r-project.org/web/packages/ggplot2/ggplot2.pdf. Erişim Tarihi: 14.02.2022.
  • Yıldız, U. A. (2015), Büyük veri kahramanı veri bilimci, Bilim ve Teknik, 569, 76-79.

Başlığında “Data Science” İfadesi Geçen Uluslararası Kongrelerde Sunulan Bildiri Özetlerinin Metin Madenciliği Yöntemleri İle İncelenmesi

Yıl 2022, Cilt: 4 Sayı: 1, 1 - 21, 30.06.2022
https://doi.org/10.51541/nicel.1075225

Öz

Veri Bilimi kavramının ortaya çıkması ile birlikte, veriye dayalı karar verme süreçleri ve bu süreçlerde kullanılan yöntemler, klasik istatistiksel yöntemlerin yanı sıra bilişim teknolojilerinin sağladığı olanakların kullanıldığı makine öğrenme, derin öğrenme vb. algoritmaların gelişmesini sağlamıştır. Günümüzde veriyi elde etmeden daha çok, hızla artan bir veri yapısı için veriyi anlama, örüntülerini ortaya koyma, işlevsel biçimde modelleme ve sonuçlarının üretilmesi önem kazanmıştır. Bu nedenle “Veri Bilimi” kavramı istatistik kongrelerinin adı ve içeriğinde de değişime neden olmuştur. Bu çalışma, metin madenciliği kullanılarak istatistik kongrelerinde geçen “Veri Bilimi” kavramının incelemesine odaklanmıştır. Bu kongrelerde sunulan ve bildiri kitaplarında basılan bildirilerin özet içeriklerinin incelenmesi ve eğilimlerinin belirlenmesi, veri biliminde önemli bir yere sahip olan metin madenciliği yöntemleri bakımından incelenmiştir. Bu çalışma, veri bilimi kavramı ile birlikte kongrelerde yer alan bildiri özetlerinin içeriklerindeki eğilimleri ortaya koymaktadır.

Kaynakça

  • Albayrak, A. (2020), Doğal dil işleme teknikleri kullanılarak disiplinler arası lisansüstü ders içeriği hazırlanması, Bilişim Teknolojileri Dergisi, 13(4), 373-383.
  • Başkaya, F. ve Aydın, İ. (2017), Haber metinlerinin farklı metin madenciliği yöntemleriyle sınıflandırılması, 2017 International Artificial Intelligence and Data Processing Symposium (IDAP), Malatya, Türkiye.
  • Cao, L. (2017), Data science: A comprehensive overview, ACM Computing Surveys, 50(3), 1-42.
  • Dang, S. and Ahmad, P. H. (2014), Text Mining: Techniques and its application, IJETI International Journal of Engineering & Technology Innovations, 1(4), 22-25.
  • Davenport, T. H. and Patil, D. J. (2012). Data Scientist: The sexiest job of the 21st Century, Harvard Business Review, 90(10), 70–76.
  • Dhar, V. (2013), Data science and prediction, Communications of the ACM, 56(12), 64-73.
  • Feinerer, I., Hornik K. and Meyer, D. (2008), Text Mining Infrastructure in R, Journal of Statistical Software, 25(5), 1–54.
  • Gök, M. (2022), Veri Bilimi, https://dergipark.org.tr/en/pub/veri. Erişim Tarihi: 14. 02.2022.
  • Gökalp, M. O., Kayabay, K., Çoban, S., Yandık, Y. B. ve Eren, P. E. (2018), Büyük veri çağında ı̇şletmelerde veri bilimi, 5. International Management Information Systems Conference (IMISC), 24-26 Kasım 2018, Ankara, Türkiye.
  • Gupta V. and Lehal, G. S. (2009), A survey of text mining techniques and applications, Journal of Emerging Technologies in Web Intelligence, 1(1), 60-76.
  • Gümüşsu, E. ve Murat, N. (2019), ‘Tamam’ ve ‘Devam’ etiketleriyle atılan tweetler ile cumhur ve millet ittifakı grupları arasındaki ilişkinin incelenmesi, Bilişim Teknolojileri Dergisi, 12(4), 287-298.
  • Hayashi, C. (1998), What is data science? Fundamental concepts and a heuristic example, Hayashi C., Yajima K., Bock HH., Ohsumi N., Tanaka Y., Baba Y. (eds), Data Science, Classification, and Related Methods. Studies in Classification, Data Analysis, and Knowledge Organization, 40-51, Springer, Tokyo.
  • Kauermann, G. and Seidl, T. (2018), Data science: A proposal for a curriculum, International Journal of Data Science and Analytics, 6(3), 195–199.
  • Kılıç, G. G., Turanli, M. and Özden, Ü. H. (2019), Data mining and statistics in data science, International Social Sciences Studies Journal, 5(30), 960–968.
  • Muthukadan, B. (2022), Selenium Python documentation. https://selenium-python.readthedocs.io/installation.html. Erişim Tarihi: 14 Şubat 2022.
  • Press, G. (2022), A Very Short History of Data Science, https://www.forbes.com/sites/gilpress/2013/05/28/a-very-short-history-of-data-science/?sh=56de23555cfc. Erişim Tarihi: 14.02.2022.
  • Python Software Foundation (2022), Python Language Reference, version 3.8.3, http://www.python.org. Erişim Tarihi: 14.02.2022.
  • R Core Team (2022), R: A language and environment for statistical computing, https://www.R-project.org/. Erişim Tarihi: 14.02.2022.
  • Radovilsky, Z., Hegde, V., Acharya, A. and Uma, U. (2018), Skills requirements of business data analytics and data science jobs: A comparative analysis, Journal of Supply Chain and Operations Management, 16(1), 82-101.
  • Richardson, L. (2022), Beautiful soup documentation, Python library version 4.10.0, https://www.crummy.com/software/BeautifulSoup/bs4/doc/. Erişim Tarihi: 14.02.2022.
  • Silge, J. and Robinson, D. (2016), tidytext: Text mining and analysis using tidy data principles in R, JOSS, 1(3), 1-3.
  • Sütçü, C. ve Aytekin, Ç. (2018), Veri Bilimi, 1. baskı, (137-140), Paloma Yayınevi, İstanbul, Türkiye.
  • Takcı H. ve Baktır, N. (2018), Büyük veri yaklaşımıyla birden çok bilgi erişim merkezinin kolektif kullanımı, Bilişim Teknolojileri Dergisi, 11(2), 123-129.
  • Temmuz Gürcanok, O. (2020), E-Ticaret satış verileri üzerinde bir veri bilimi vaka çalışması, Yüksek Lisans Tezi, Maltepe Üniversitesi, İstanbul, Türkiye.
  • Weihs, C. and Ickstadt, K. (2018), Data science: The impact of statistics, International Journal of Data Science and Analytics, 6(3), 189–194.
  • Wickham, H (2022), stringr: Simple, Consistent Wrappers for Common String Operations Package. R package version 1.4.0, https://cran.r-project.org/web/packages/stringr/index.html. Erişim Tarihi: 14.02.2022.
  • Wickham, H., Chang, W., Henry, L., Pedersen, T. L., Takahashi, K., Wilke, C., Woo, K., Yutani, H., Dunnington, D. and RStudio (2022). ggplot2: Create Elegant Data Visualisations Using the Grammar of Graphics. R package version 3.3.5, https://cran.r-project.org/web/packages/ggplot2/ggplot2.pdf. Erişim Tarihi: 14.02.2022.
  • Yıldız, U. A. (2015), Büyük veri kahramanı veri bilimci, Bilim ve Teknik, 569, 76-79.
Toplam 28 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular İstatistik
Bölüm Makaleler
Yazarlar

Hande Konşuk Ünlü 0000-0003-3572-0254

Yayımlanma Tarihi 30 Haziran 2022
Yayımlandığı Sayı Yıl 2022 Cilt: 4 Sayı: 1

Kaynak Göster

APA Konşuk Ünlü, H. (2022). Başlığında “Data Science” İfadesi Geçen Uluslararası Kongrelerde Sunulan Bildiri Özetlerinin Metin Madenciliği Yöntemleri İle İncelenmesi. Nicel Bilimler Dergisi, 4(1), 1-21. https://doi.org/10.51541/nicel.1075225