In construction projects, contract management processes necessitate achieving a delicate equilibrium among time, cost, and quality. This work aims to analyse Design-Build standard construction contract texts by the application of machine learning (ML) methodologies to attain a more effective equilibrium among these three essential factors, hence enhancing the decision support process in contract management. The suggested model offers comprehensive predictions regarding time, cost, and quality in the management and risk assessment of construction projects where conventional methods are inadequate. A classification model employing text mining and ML algorithms is proposed in the study. The standard contract clauses of the FIDIC Conditions of Contract for Design, Build and Operate, as well as the JCT Design and Build Contract, have been analysed. In the realm of text mining, natural language processing (NLP) methodologies, including Term Frequency-Inverse Document Frequency (TF-IDF), Word2Vec (Continous Bag-of-Words (CBOW) and Skip-Gram), and Bag-of-Words (BoW), have been employed. Various ML algorithms, including Support Vector Machines (SVM), Decision Trees (DT), and Ensemble Learning (EL) techniques (XGBoost), have been employed to evaluate the efficacy of various text representation techniques. The models' performance was evaluated using 70%-30% and 80%-20% training-test data splits. The study concluded that the integration of the Skip-Gram approach with the XGBoost model yielded the highest accuracy (Acc) and F1 scores. In the 80%-20% train-test split, the F1 score was recorded at 0.8858 and the Acc at 0.8779, highlighting the significance of capturing contextual information. The primary constraint of the study is the inability to make a precise separation in the dataset, since the time and cost aspects in contract texts frequently overlap. This circumstance has led the model to erroneously categorise certain words into both the cost and time classifications, hence diminishing accuracy rates. The variety of legal and technical terminology in contracts has hindered the model's ability to appropriately evaluate some expressions. The results demonstrate that ML provides a novel approach to analysing construction contracts and has the capacity to enhance decision-making in contract management and negotiations. The model presented in this paper provides a framework for the more efficient management of time, cost, and quality factors.
Standard Construction Contracts Natural Language Processing Machine Learning Ensemble Learning Text Mining
This study does not involve human or animal participants. All procedures followed scientific and ethical principles, and all referenced studies are appropriately cited
Bu çalışma, inşaat sektöründe yaygın olarak kullanılan Tasarla-İnşa Et (Design-Build) standart sözleşme metinlerinin analizinde makine öğrenimi tekniklerinin kullanımını incelemektedir. Zaman, maliyet ve kalite ekseninde gerçekleştirilen analiz, inşaat projelerinin yönetimi ve risk değerlendirmesi açısından önemli bir adım teşkil etmektedir. Çalışmada, metin madenciliği (text mining) ve makine öğrenimi algoritmalarından yararlanan bir sınıflandırma modeli önerilmektedir. Özellikle, FIDIC Conditions of Contract for Design, Build and Operate ve JCT Design and Build Contract standart sözleşme hükümleri incelenmiştir. Metin madenciliği bağlamında TF-IDF, Word2Vec (CBOW ve Skip-Gram) ve Bag-of-Words (BoW) gibi doğal dil işleme (NLP) teknikleri kullanılmıştır. Destek Vektör Makineleri (SVM), Karar Ağaçları (DT) ve Topluluk Öğrenmesi (XGBoost) gibi çeşitli makine öğrenimi algoritmaları ile farklı metin temsil yöntemlerinin performansları karşılaştırılmıştır. Modellerin başarımı, %70-%30 ve %80-%20 eğitim-test veri ayrımları altında analiz edilmiştir. Çalışma sonucunda, Skip-Gram yöntemi ile XGBoost modeli en yüksek doğruluk ve F1 skorlarını elde ederek en başarılı kombinasyon olarak belirlenmiştir. Özellikle %80-20 eğitim-test ayrımında F1 skoru 0.8858 ve doğruluk 0.8779 olarak ölçülmüştür, bu da bağlamsal bilgi yakalama yeteneğinin önemini göstermektedir. Ancak, çalışmanın en önemli sınırlılığı, sözleşme metinlerinde süre ve maliyet unsurlarının çoğu zaman iç içe geçmesi nedeniyle veri setinde kesin bir ayrımın yapılamamış olmasıdır. Bu durum, modelin bazı kelimeleri hem maliyet hem de süre kategorisine yanlış tahsis etmesine neden olarak doğruluk oranlarını düşürmüştür. Ayrıca, sözleşmelerde kullanılan hukuki ve teknik terimlerin çeşitliliği, modelin bazı ifadeleri doğru anlamlandırmasını zorlaştırmıştır. Elde edilen bulgular, makine öğreniminin inşaat sözleşmelerinin analizine dair yeni bir bakış açısı sunduğunu ve sözleşme yönetimi ile müzakerelerde karar verme süreçlerini iyileştirme potansiyeline sahip olduğunu göstermektedir. Bu çalışmada önerilen model, zaman, maliyet ve kalite unsurlarının daha verimli yönetilmesine yardımcı olacak bir çerçeve sunmaktadır.
Standart inşaat sözleşmeleri Doğal dil işleme Makine öğrenimi Topluluk öğrenmesi Metin madenciliği
| Primary Language | English |
|---|---|
| Subjects | Machine Learning Algorithms, Construction Business |
| Journal Section | Articles |
| Authors | |
| Publication Date | October 30, 2025 |
| Submission Date | March 24, 2025 |
| Acceptance Date | June 4, 2025 |
| Published in Issue | Year 2025 Volume: 13 Issue: 4 |