Accurate price prediction in the real estate market is important for buyers, sellers, and investors. This study evaluates the performance of various machine learning models including AdaBoost, Gradient Boosting, k-Nearest Neighbors (kNN), Artificial Neural Networks, and Support Vector Machines (SVM) to predict house prices in Gaziantep, Turkey. Parameters such as number of rooms, square meters, building age, floor level, and neighborhood are taken as datasets from a real estate website. A hybrid study is conducted to improve the model performance by clustering analysis using the Simple K-Means algorithm in WEKA application and categorizing the data into groups according to the parameters. The clustered data served as input for Orange 3. Model performance is evaluated using metrics such as Mean Square Error (MSE), Root Mean Square Error (RMSE), Mean Absolute Error (MAE), Mean Absolute Percentage Error (MAPE), and R². The results show that AdaBoost consistently achieves the highest accuracy and reliability, followed by Gradient Boosting, which demonstrates strong generalization capabilities. While kNN provided moderate performance, Neural Networks and SVM performed poorly, showing high error measures and poor adaptability.
House Price Prediction Machine Learning AdaBoost Gradient Boosting Clustering Orange 3 Real Estate Analytics Predictive Modeling
Gayrimenkul piyasasında doğru fiyat tahmini alıcılar, satıcılar ve yatırımcılar için önemlidir. Bu çalışmada, Türkiye, Gaziantep'teki ev fiyatlarını tahmin etmek için AdaBoost, Gradient Boosting, k-En Yakın Komşular (kNN), Yapay Sinir Ağları ve Destek Vektör Makineleri (SVM) dahil olmak üzere çeşitli makine öğrenimi modellerinin performansı değerlendirilmiştir. Oda sayısı, metrekare, bina yaşı, kat seviyesi ve mahalle gibi parametreler bir emlak web sitesinden veri kümesi olarak alınmıştır. WEKA uygulamasında Basit K-Ortalamalar algoritması kullanılarak kümeleme analizi yapılarak ve veriler parametrelere göre gruplara ayrılarak model performansını iyileştirmek için hibrit bir çalışma yürütülmüştür. Kümelenmiş veriler Orange 3 için girdi olarak kullanılmıştır. Model performansı, Ortalama Karesel Hata (MSE), Kök Ortalama Karesel Hata (RMSE), Ortalama Mutlak Hata (MAE), Ortalama Mutlak Yüzdelik Hata (MAPE) ve R² gibi metrikler kullanılarak değerlendirilmiştir. Sonuçlar AdaBoost'un sürekli olarak en yüksek doğruluk ve güvenirliliğe ulaştığını, ardından güçlü genelleme yetenekleri gösteren Gradient Boosting'in geldiğini göstermektedir. kNN orta düzeyde performans sağlarken, Sinir Ağları ve SVM düşük performans göstererek yüksek hata ölçümleri ve zayıf uyarlanabilirlik göstermiştir.
Ev Fiyat Tahmini Makine Öğrenmesi AdaBoost Gradient Boosting Kümeleme Orange 3 Emlak Analitiği Tahmini Modelleme
| Birincil Dil | İngilizce |
|---|---|
| Konular | Modelleme ve Simülasyon |
| Bölüm | Makaleler |
| Yazarlar | |
| Erken Görünüm Tarihi | 24 Temmuz 2025 |
| Yayımlanma Tarihi | 31 Temmuz 2025 |
| Gönderilme Tarihi | 16 Haziran 2025 |
| Kabul Tarihi | 22 Temmuz 2025 |
| Yayımlandığı Sayı | Yıl 2025 Cilt: 9 Sayı: 1 |