After 2000s, Computer capacities and features are increased and access to data made easy. However, the produced and recorded data should be meaningful. Transformation of unprocessed data into meaningful information can be done with the help of data mining. In this study, classification methods from data mining applications are studied. First, the parameters that make the results of the same data set different were investigated on 4 different data mining tools (Weka, Rapid Miner, Knime, Orange), It has been tested with 3 different algorithms (K nearest neighborhood, Naive Bayes, Random Forest). In order to evaluate the performance of the data set while creating the classification models, the data set was divided into training data and test data as 80% -20%, 70% -30% and 60-40%. The accuracy, roc and precision values was used to test the performance of the classifying data. While classifying, the effect of algorithm parameters on the results is observed. The most important of these parameters is the initial seed value. The initial seed is a value using especially in classification algorithms that determines the initial placement of the data and directly affects the result. In this respect, it is very important to determine the initial seed value correctly. In this study, initial seed values between 0 and 100 were evaluated and it was shown that the classification could change the accuracy value approximately by 5%.
2000'li yıllardan sonra, Bilgisayar kapasiteleri ve özellikleri artmış ve verilere erişim kolaylaşmıştır. Ancak üretilen ve kaydedilen veriler anlamlı olmalıdır. İşlenmemiş verilerin anlamlı bilgilere dönüştürülmesi, veri madenciliği yardımı ile yapılabilmektedir. Bu çalışmada, veri madenciliği uygulamalarından sınıflandırma yöntemleri incelenmiştir. Öncelikle aynı veri setinin sonuçlarını farklı kılan parametreler 4 farklı veri madenciliği aracında (Weka, Rapid Miner, Knime, Orange) araştırılmış, 3 farklı algoritma ile test edilmiştir (K nearest neighborhood, Naive Bayes, Random Forest). Sınıflandırma modelleri oluşturulurken veri setinin performansını değerlendirmek için veri seti eğitim verileri ve test verileri olarak % 80-% 20, % 70-% 30 ve% 60-40 olarak ayrılmıştır. Accuracy, roc and precision değerleri, sınıflandırma verilerinin performansını test etmek için kullanılmıştır. Sınıflandırma yapılırken algoritma parametrelerinin sonuçlar üzerindeki etkisi gözlemlenmiştir. Bu parametrelerden en önemlisi ilk tohum değeridir. İlk tohum, özellikle verilerin ilk yerleşimini belirleyen ve sonucu doğrudan etkileyen sınıflandırma algoritmalarında kullanılan bir değerdir. Bu açıdan ilk tohum değerinin doğru belirlenmesi çok önemlidir. Bu çalışmada 0 ile 100 arasındaki başlangıç tohum değerleri değerlendirilmiş ve sınıflandırmanın doğruluk değerini yaklaşık %5 değiştirebileceği gösterilmiştir.
Primary Language | English |
---|---|
Subjects | Engineering |
Journal Section | Articles |
Authors |
|
Publication Date | April 25, 2021 |
Published in Issue | Year 2021, Volume 9, Issue 2 |
Bibtex | @research article { dubited813101, journal = {Düzce Üniversitesi Bilim ve Teknoloji Dergisi}, eissn = {2148-2446}, address = {}, publisher = {Duzce University}, year = {2021}, volume = {9}, number = {2}, pages = {555 - 567}, doi = {10.29130/dubited.813101}, title = {Initial Seed Value Effectiveness on Performances of Data Mining Algorithms}, key = {cite}, author = {Timuçin, Tunahan and Duzdar Argun, İrem} } |
APA | Timuçin, T. & Duzdar Argun, İ. (2021). Initial Seed Value Effectiveness on Performances of Data Mining Algorithms . Düzce Üniversitesi Bilim ve Teknoloji Dergisi , 9 (2) , 555-567 . DOI: 10.29130/dubited.813101 |
MLA | Timuçin, T. , Duzdar Argun, İ. "Initial Seed Value Effectiveness on Performances of Data Mining Algorithms" . Düzce Üniversitesi Bilim ve Teknoloji Dergisi 9 (2021 ): 555-567 <https://dergipark.org.tr/en/pub/dubited/issue/61950/813101> |
Chicago | Timuçin, T. , Duzdar Argun, İ. "Initial Seed Value Effectiveness on Performances of Data Mining Algorithms". Düzce Üniversitesi Bilim ve Teknoloji Dergisi 9 (2021 ): 555-567 |
RIS | TY - JOUR T1 - Initial Seed Value Effectiveness on Performances of Data Mining Algorithms AU - Tunahan Timuçin , İrem Duzdar Argun Y1 - 2021 PY - 2021 N1 - doi: 10.29130/dubited.813101 DO - 10.29130/dubited.813101 T2 - Düzce Üniversitesi Bilim ve Teknoloji Dergisi JF - Journal JO - JOR SP - 555 EP - 567 VL - 9 IS - 2 SN - -2148-2446 M3 - doi: 10.29130/dubited.813101 UR - https://doi.org/10.29130/dubited.813101 Y2 - 2021 ER - |
EndNote | %0 Duzce University Journal of Science and Technology Initial Seed Value Effectiveness on Performances of Data Mining Algorithms %A Tunahan Timuçin , İrem Duzdar Argun %T Initial Seed Value Effectiveness on Performances of Data Mining Algorithms %D 2021 %J Düzce Üniversitesi Bilim ve Teknoloji Dergisi %P -2148-2446 %V 9 %N 2 %R doi: 10.29130/dubited.813101 %U 10.29130/dubited.813101 |
ISNAD | Timuçin, Tunahan , Duzdar Argun, İrem . "Initial Seed Value Effectiveness on Performances of Data Mining Algorithms". Düzce Üniversitesi Bilim ve Teknoloji Dergisi 9 / 2 (April 2021): 555-567 . https://doi.org/10.29130/dubited.813101 |
AMA | Timuçin T. , Duzdar Argun İ. Initial Seed Value Effectiveness on Performances of Data Mining Algorithms. DUBİTED. 2021; 9(2): 555-567. |
Vancouver | Timuçin T. , Duzdar Argun İ. Initial Seed Value Effectiveness on Performances of Data Mining Algorithms. Düzce Üniversitesi Bilim ve Teknoloji Dergisi. 2021; 9(2): 555-567. |
IEEE | T. Timuçin and İ. Duzdar Argun , "Initial Seed Value Effectiveness on Performances of Data Mining Algorithms", Düzce Üniversitesi Bilim ve Teknoloji Dergisi, vol. 9, no. 2, pp. 555-567, Apr. 2021, doi:10.29130/dubited.813101 |