Conference Paper
BibTex RIS Cite

Open Source Data Mining Programs: A Case Study on R

Year 2018, Volume:6 No:2 (2018) (Special Issue: IMCOFE 2017), 455 - 468, 06.04.2018

Abstract

The processes on the way from raw
data to meaningful information is called data mining. The data is processed by
applying various methods of data mining in order to extract hidden information
among raw data. The processed raw data becomes usable in the next steps of data
mining. There are many open source and commercial applications to be used in
data mining and data processing. In this study, information about data mining programs
are given, and a case study on the R program from these programs have been done.

References

  • [1] M. Dener, “Açık Kaynak kodlu Veri Madenciliği Programları:WEKA’da Örnek Uygulama” presented at 11th Acad. Inform.Conf., 2009, Şanlıurfa, Turkey, 2009.
  • [2] M. Kaya, S. A. Özel, Açık Kaynak Kodlu Veri Madenciliği Yazılımlarının Karşılaştırılması, presented 14th Acad. Inform. Conf., 2014, Mersin, Turkey, 2014.
  • [3] Ö. Yalçın, Veri Madenciliği Yöntemleri, 2nd Ed., Papatya Yayıncılık, 2013.
  • [4] J. Han, M. Kanber, Data Mining: Concepts and Techniques, Morgan Kaufmann, 2006.
  • [5] M.J. Berry, G.S. Linoff, Mastering Data Mining, John Wiley&Sons, New York, 2004.
  • [6] L.B.Ayre, Data Mining For Information Professionals, June, 2006.
  • [7] E. Alpaydın, Zeki Veri Madenciliği: Ham Veridan Altın Bilgiye Ulaşma Yöntemleri, 2000.
  • [8] Anonymous, R (Programming Language) [Online]. Available: https://en.0wikipedia.org/index.php?q=aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvUl8ocHJvZ3JhbW1pbmdfbGFuZ3VhZ2Up
  • [9] P. Gregory, Top Analytics, Data Science Software – Kdnuggets Software Poll Results, [Online]. Available: https://www.kdnuggets.com/2016/06/r-python-top-analytics-data-mining-data-science-software.html
  • [10] van Buuren, Stef, et al. Mice Packages, Computer software. Retrieved from: http://cran. r-project. org/web/packages/mice/mice.pdf (2015).
  • [11] T. Therneau, B. Atkinson, B. Ripley, Rpart Packages. [Online]. Available: https://cran.r-project.org/web/packages/rpart/rpart.pdf. 2017.
  • [12] T. Hornik, C. Buchta, T. Hothorn, A. Karatzoglou, D. Meyer, A.Zeleis, RWeka Packages, [Online]. Available: https://cran.r-project.org/web/packages/RWeka/RWeka.pdf, 2016.
  • [13] T. Horthon, A. Zeileis, Partykit Packages, [Online]. Available: https://cran.r-project.org/web/packages/partykit/ partykit.pdf, 2016.
  • [14] M. Kuhn, J. Wing, S. Weston, A. Williams, C. Keefer, A. Engelhardt, C. Candan, Caret: Classification and Regression Training, [Online]. Available: https://cran.r-project.org/pub/R/web/packages/caret/caret.pdf, 2016.
  • [15] Ş. Özdemir, “Eğitsel Veri Madenciliği Çalışması: Lise Öğrencilerinin Okula Devamlılık Durumlarının Öngörülmesi”, R ile Veri Madenciliği (Balaban-Kartal), Çağlayan Kitabevi, 2016

Açık Kaynak Kodlu Veri Madenciliği Programları: R 'da Örnek Uygulama

Year 2018, Volume:6 No:2 (2018) (Special Issue: IMCOFE 2017), 455 - 468, 06.04.2018

Abstract

Ham
verilerden anlamlı bilgilere geçiş sürecine veri madenciliği denir. Veri, ham
veriler arasında gizli bilgileri çıkarmak için çeşitli veri madenciliği
yöntemleri uygulanarak işlenir. İşlenmiş ham veriler, veri madenciliğinin bir
sonraki aşamasında kullanılabilir hale gelir. Veri madenciliği ve veri işlemede
kullanılmak üzere birçok açık kaynak ve ticari uygulama vardır. Bu çalışmada
veri madenciliği programları hakkında bilgi verilmiş ve R programı üzerinde bir
vaka çalışması sunulmuştur. R programı, çeşitli grafiklerle de gösterildiği üzere
kullanıcılar arasında büyük bir tercih oranına sahip olması dolayısıyla
seçilmiştir.

References

  • [1] M. Dener, “Açık Kaynak kodlu Veri Madenciliği Programları:WEKA’da Örnek Uygulama” presented at 11th Acad. Inform.Conf., 2009, Şanlıurfa, Turkey, 2009.
  • [2] M. Kaya, S. A. Özel, Açık Kaynak Kodlu Veri Madenciliği Yazılımlarının Karşılaştırılması, presented 14th Acad. Inform. Conf., 2014, Mersin, Turkey, 2014.
  • [3] Ö. Yalçın, Veri Madenciliği Yöntemleri, 2nd Ed., Papatya Yayıncılık, 2013.
  • [4] J. Han, M. Kanber, Data Mining: Concepts and Techniques, Morgan Kaufmann, 2006.
  • [5] M.J. Berry, G.S. Linoff, Mastering Data Mining, John Wiley&Sons, New York, 2004.
  • [6] L.B.Ayre, Data Mining For Information Professionals, June, 2006.
  • [7] E. Alpaydın, Zeki Veri Madenciliği: Ham Veridan Altın Bilgiye Ulaşma Yöntemleri, 2000.
  • [8] Anonymous, R (Programming Language) [Online]. Available: https://en.0wikipedia.org/index.php?q=aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvUl8ocHJvZ3JhbW1pbmdfbGFuZ3VhZ2Up
  • [9] P. Gregory, Top Analytics, Data Science Software – Kdnuggets Software Poll Results, [Online]. Available: https://www.kdnuggets.com/2016/06/r-python-top-analytics-data-mining-data-science-software.html
  • [10] van Buuren, Stef, et al. Mice Packages, Computer software. Retrieved from: http://cran. r-project. org/web/packages/mice/mice.pdf (2015).
  • [11] T. Therneau, B. Atkinson, B. Ripley, Rpart Packages. [Online]. Available: https://cran.r-project.org/web/packages/rpart/rpart.pdf. 2017.
  • [12] T. Hornik, C. Buchta, T. Hothorn, A. Karatzoglou, D. Meyer, A.Zeleis, RWeka Packages, [Online]. Available: https://cran.r-project.org/web/packages/RWeka/RWeka.pdf, 2016.
  • [13] T. Horthon, A. Zeileis, Partykit Packages, [Online]. Available: https://cran.r-project.org/web/packages/partykit/ partykit.pdf, 2016.
  • [14] M. Kuhn, J. Wing, S. Weston, A. Williams, C. Keefer, A. Engelhardt, C. Candan, Caret: Classification and Regression Training, [Online]. Available: https://cran.r-project.org/pub/R/web/packages/caret/caret.pdf, 2016.
  • [15] Ş. Özdemir, “Eğitsel Veri Madenciliği Çalışması: Lise Öğrencilerinin Okula Devamlılık Durumlarının Öngörülmesi”, R ile Veri Madenciliği (Balaban-Kartal), Çağlayan Kitabevi, 2016
There are 15 citations in total.

Details

Primary Language English
Subjects Engineering
Journal Section Articles
Authors

Fatih Kayaalp

Muhammet Sinan Başarslan

Publication Date April 6, 2018
Published in Issue Year 2018 Volume:6 No:2 (2018) (Special Issue: IMCOFE 2017)

Cite

APA Kayaalp, F., & Başarslan, M. S. (2018). Open Source Data Mining Programs: A Case Study on R. Duzce University Journal of Science and Technology, 6(2), 455-468.
AMA Kayaalp F, Başarslan MS. Open Source Data Mining Programs: A Case Study on R. DUBİTED. April 2018;6(2):455-468.
Chicago Kayaalp, Fatih, and Muhammet Sinan Başarslan. “Open Source Data Mining Programs: A Case Study on R”. Duzce University Journal of Science and Technology 6, no. 2 (April 2018): 455-68.
EndNote Kayaalp F, Başarslan MS (April 1, 2018) Open Source Data Mining Programs: A Case Study on R. Duzce University Journal of Science and Technology 6 2 455–468.
IEEE F. Kayaalp and M. S. Başarslan, “Open Source Data Mining Programs: A Case Study on R”, DUBİTED, vol. 6, no. 2, pp. 455–468, 2018.
ISNAD Kayaalp, Fatih - Başarslan, Muhammet Sinan. “Open Source Data Mining Programs: A Case Study on R”. Duzce University Journal of Science and Technology 6/2 (April 2018), 455-468.
JAMA Kayaalp F, Başarslan MS. Open Source Data Mining Programs: A Case Study on R. DUBİTED. 2018;6:455–468.
MLA Kayaalp, Fatih and Muhammet Sinan Başarslan. “Open Source Data Mining Programs: A Case Study on R”. Duzce University Journal of Science and Technology, vol. 6, no. 2, 2018, pp. 455-68.
Vancouver Kayaalp F, Başarslan MS. Open Source Data Mining Programs: A Case Study on R. DUBİTED. 2018;6(2):455-68.