TY - JOUR T1 - Real Estate Price Estimation with AI: A Hybrid Approach Combining Clustering and Machine Learning TT - Yapay Zeka ile Gayrimenkul Fiyat Tahmini: Kümeleme ve Makine Öğrenimini Birleştiren Hibrit Bir Yaklaşım AU - Okurlar, Hatice AU - Eroğlu, Yunus PY - 2025 DA - August Y2 - 2025 JF - International Journal of Multidisciplinary Studies and Innovative Technologies JO - IJMSIT PB - SET Teknoloji WT - DergiPark SN - 2602-4888 SP - 137 EP - 144 VL - 9 IS - 1 LA - en AB - Accurate price prediction in the real estate market is important for buyers, sellers, and investors. This study evaluates the performance of various machine learning models including AdaBoost, Gradient Boosting, k-Nearest Neighbors (kNN), Artificial Neural Networks, and Support Vector Machines (SVM) to predict house prices in Gaziantep, Turkey. Parameters such as number of rooms, square meters, building age, floor level, and neighborhood are taken as datasets from a real estate website. A hybrid study is conducted to improve the model performance by clustering analysis using the Simple K-Means algorithm in WEKA application and categorizing the data into groups according to the parameters. The clustered data served as input for Orange 3. Model performance is evaluated using metrics such as Mean Square Error (MSE), Root Mean Square Error (RMSE), Mean Absolute Error (MAE), Mean Absolute Percentage Error (MAPE), and R². The results show that AdaBoost consistently achieves the highest accuracy and reliability, followed by Gradient Boosting, which demonstrates strong generalization capabilities. While kNN provided moderate performance, Neural Networks and SVM performed poorly, showing high error measures and poor adaptability. KW - House Price Prediction KW - Machine Learning KW - AdaBoost KW - Gradient Boosting KW - Clustering KW - Orange 3 KW - Real Estate Analytics KW - Predictive Modeling N2 - Gayrimenkul piyasasında doğru fiyat tahmini alıcılar, satıcılar ve yatırımcılar için önemlidir. Bu çalışmada, Türkiye, Gaziantep'teki ev fiyatlarını tahmin etmek için AdaBoost, Gradient Boosting, k-En Yakın Komşular (kNN), Yapay Sinir Ağları ve Destek Vektör Makineleri (SVM) dahil olmak üzere çeşitli makine öğrenimi modellerinin performansı değerlendirilmiştir. Oda sayısı, metrekare, bina yaşı, kat seviyesi ve mahalle gibi parametreler bir emlak web sitesinden veri kümesi olarak alınmıştır. WEKA uygulamasında Basit K-Ortalamalar algoritması kullanılarak kümeleme analizi yapılarak ve veriler parametrelere göre gruplara ayrılarak model performansını iyileştirmek için hibrit bir çalışma yürütülmüştür. Kümelenmiş veriler Orange 3 için girdi olarak kullanılmıştır. Model performansı, Ortalama Karesel Hata (MSE), Kök Ortalama Karesel Hata (RMSE), Ortalama Mutlak Hata (MAE), Ortalama Mutlak Yüzdelik Hata (MAPE) ve R² gibi metrikler kullanılarak değerlendirilmiştir. Sonuçlar AdaBoost'un sürekli olarak en yüksek doğruluk ve güvenirliliğe ulaştığını, ardından güçlü genelleme yetenekleri gösteren Gradient Boosting'in geldiğini göstermektedir. kNN orta düzeyde performans sağlarken, Sinir Ağları ve SVM düşük performans göstererek yüksek hata ölçümleri ve zayıf uyarlanabilirlik göstermiştir. CR - [1] Smith, J., & Taylor, A. (2018). Hedonic pricing in real estate: Limitations and advancements. Journal of Housing Research, 35(2), 120-135. CR - [2] Zhang, X., & Wang, Y. (2020). Machine learning approaches to real estate price prediction. International Journal of Data Science, 42(1), 89-105. CR - [3] Khan, R., et al. (2021). Ensemble learning methods for predictive analytics in real estate. Data Analytics Quarterly, 15(4), 214-230. CR - [4] Brown, J., & Taylor, A. (2019). Simpler models for real estate prediction: Opportunities and limitations. Real Estate Journal, 45(3), 156-170. CR - [5] Lee, J., & Li, Y. (2020). Clustering in predictive modeling: A case study in real estate markets. Journal of Predictive Analytics, 18(3), 345-360. CR - [6] Eroğlu, Y. (2024). IMDb score estimation using movie dialogues: A text mining and machine learning hybrid approach. Proceedings of IDSSC 2024, 1-10. CR - [7] Li, Y., & Li, J. (2006). Data mining techniques in real estate market analysis. Real Estate Trends Quarterly, 22(3), 112-128. UR - https://dergipark.org.tr/tr/pub/ijmsit/issue//1720558 L1 - https://dergipark.org.tr/tr/download/article-file/4963194 ER -