Araştırma Makalesi
BibTex RIS Kaynak Göster

Real Estate Price Estimation with AI: A Hybrid Approach Combining Clustering and Machine Learning

Yıl 2025, Cilt: 9 Sayı: 1, 137 - 144, 31.07.2025

Öz

Accurate price prediction in the real estate market is important for buyers, sellers, and investors. This study evaluates the performance of various machine learning models including AdaBoost, Gradient Boosting, k-Nearest Neighbors (kNN), Artificial Neural Networks, and Support Vector Machines (SVM) to predict house prices in Gaziantep, Turkey. Parameters such as number of rooms, square meters, building age, floor level, and neighborhood are taken as datasets from a real estate website. A hybrid study is conducted to improve the model performance by clustering analysis using the Simple K-Means algorithm in WEKA application and categorizing the data into groups according to the parameters. The clustered data served as input for Orange 3. Model performance is evaluated using metrics such as Mean Square Error (MSE), Root Mean Square Error (RMSE), Mean Absolute Error (MAE), Mean Absolute Percentage Error (MAPE), and R². The results show that AdaBoost consistently achieves the highest accuracy and reliability, followed by Gradient Boosting, which demonstrates strong generalization capabilities. While kNN provided moderate performance, Neural Networks and SVM performed poorly, showing high error measures and poor adaptability.

Kaynakça

  • [1] Smith, J., & Taylor, A. (2018). Hedonic pricing in real estate: Limitations and advancements. Journal of Housing Research, 35(2), 120-135.
  • [2] Zhang, X., & Wang, Y. (2020). Machine learning approaches to real estate price prediction. International Journal of Data Science, 42(1), 89-105.
  • [3] Khan, R., et al. (2021). Ensemble learning methods for predictive analytics in real estate. Data Analytics Quarterly, 15(4), 214-230.
  • [4] Brown, J., & Taylor, A. (2019). Simpler models for real estate prediction: Opportunities and limitations. Real Estate Journal, 45(3), 156-170.
  • [5] Lee, J., & Li, Y. (2020). Clustering in predictive modeling: A case study in real estate markets. Journal of Predictive Analytics, 18(3), 345-360.
  • [6] Eroğlu, Y. (2024). IMDb score estimation using movie dialogues: A text mining and machine learning hybrid approach. Proceedings of IDSSC 2024, 1-10.
  • [7] Li, Y., & Li, J. (2006). Data mining techniques in real estate market analysis. Real Estate Trends Quarterly, 22(3), 112-128.

Yapay Zeka ile Gayrimenkul Fiyat Tahmini: Kümeleme ve Makine Öğrenimini Birleştiren Hibrit Bir Yaklaşım

Yıl 2025, Cilt: 9 Sayı: 1, 137 - 144, 31.07.2025

Öz

Gayrimenkul piyasasında doğru fiyat tahmini alıcılar, satıcılar ve yatırımcılar için önemlidir. Bu çalışmada, Türkiye, Gaziantep'teki ev fiyatlarını tahmin etmek için AdaBoost, Gradient Boosting, k-En Yakın Komşular (kNN), Yapay Sinir Ağları ve Destek Vektör Makineleri (SVM) dahil olmak üzere çeşitli makine öğrenimi modellerinin performansı değerlendirilmiştir. Oda sayısı, metrekare, bina yaşı, kat seviyesi ve mahalle gibi parametreler bir emlak web sitesinden veri kümesi olarak alınmıştır. WEKA uygulamasında Basit K-Ortalamalar algoritması kullanılarak kümeleme analizi yapılarak ve veriler parametrelere göre gruplara ayrılarak model performansını iyileştirmek için hibrit bir çalışma yürütülmüştür. Kümelenmiş veriler Orange 3 için girdi olarak kullanılmıştır. Model performansı, Ortalama Karesel Hata (MSE), Kök Ortalama Karesel Hata (RMSE), Ortalama Mutlak Hata (MAE), Ortalama Mutlak Yüzdelik Hata (MAPE) ve R² gibi metrikler kullanılarak değerlendirilmiştir. Sonuçlar AdaBoost'un sürekli olarak en yüksek doğruluk ve güvenirliliğe ulaştığını, ardından güçlü genelleme yetenekleri gösteren Gradient Boosting'in geldiğini göstermektedir. kNN orta düzeyde performans sağlarken, Sinir Ağları ve SVM düşük performans göstererek yüksek hata ölçümleri ve zayıf uyarlanabilirlik göstermiştir.

Kaynakça

  • [1] Smith, J., & Taylor, A. (2018). Hedonic pricing in real estate: Limitations and advancements. Journal of Housing Research, 35(2), 120-135.
  • [2] Zhang, X., & Wang, Y. (2020). Machine learning approaches to real estate price prediction. International Journal of Data Science, 42(1), 89-105.
  • [3] Khan, R., et al. (2021). Ensemble learning methods for predictive analytics in real estate. Data Analytics Quarterly, 15(4), 214-230.
  • [4] Brown, J., & Taylor, A. (2019). Simpler models for real estate prediction: Opportunities and limitations. Real Estate Journal, 45(3), 156-170.
  • [5] Lee, J., & Li, Y. (2020). Clustering in predictive modeling: A case study in real estate markets. Journal of Predictive Analytics, 18(3), 345-360.
  • [6] Eroğlu, Y. (2024). IMDb score estimation using movie dialogues: A text mining and machine learning hybrid approach. Proceedings of IDSSC 2024, 1-10.
  • [7] Li, Y., & Li, J. (2006). Data mining techniques in real estate market analysis. Real Estate Trends Quarterly, 22(3), 112-128.
Toplam 7 adet kaynakça vardır.

Ayrıntılar

Birincil Dil İngilizce
Konular Modelleme ve Simülasyon
Bölüm Makaleler
Yazarlar

Hatice Okurlar 0009-0008-7963-4685

Yunus Eroğlu 0000-0002-8354-6783

Erken Görünüm Tarihi 24 Temmuz 2025
Yayımlanma Tarihi 31 Temmuz 2025
Gönderilme Tarihi 16 Haziran 2025
Kabul Tarihi 22 Temmuz 2025
Yayımlandığı Sayı Yıl 2025 Cilt: 9 Sayı: 1

Kaynak Göster

IEEE H. Okurlar ve Y. Eroğlu, “Real Estate Price Estimation with AI: A Hybrid Approach Combining Clustering and Machine Learning”, IJMSIT, c. 9, sy. 1, ss. 137–144, 2025.