Bu çalışma, endüstriyel üretimde enerji verimliliğini iyileştirmek amacıyla, açıklanabilir yapay zeka yaklaşımıyla desteklenen bir tahmin ve sınıflandırma modeli geliştirmeyi hedeflemektedir. Çalışmanın odak noktası, kimya endüstrisine ait üretim tesislerinden elde edilen açık veri setleri üzerinde yapılan analizler yoluyla, üretim birimlerinin enerji tüketim davranışlarını anlamak ve bu davranışlara yönelik karar destek sistemleri üretmektir. Bu bağlamda, Amerika Birleşik Devletleri Enerji Bakanlığı’na bağlı OpenEI platformu tarafından yayımlanan Foundational Industrial Energy Dataset veri seti kullanılmış ve NAICS 325 koduyla sınıflandırılan kimya endüstrisine ait üretim birimleri çalışmaya dâhil edilmiştir.
Veri setindeki değişkenler, birim tipi, yakıt türü, tasarım kapasitesi ve enerji tüketimi gibi üretimle doğrudan ilişkili teknik parametreleri kapsamaktadır. Enerji verimliliği göstergesi olarak, birim kapasitesi başına tüketilen enerji miktarını ifade eden metrik türetilmiş ve bu göstergeye göre hem regresyon hem de sınıflandırma analizleri gerçekleştirilmiştir. Çalışmada Random Forest Regressor ve Linear Regression algoritmaları kullanılmış; model başarımı R² ve MSE metrikleri üzerinden değerlendirilmiştir. Random Forest algoritması, veri yapısına daha uygun sonuçlar üretmiş ve daha yüksek performans göstermiştir.
Modelin yalnızca tahmin başarısı değil, aynı zamanda kararların şeffaflığı ve yorumlanabilirliği de değerlendirilmiştir. Bu amaçla SHAP yöntemi kullanılarak, her bir üretim değişkeninin model sonuçlarına etkisi sayısal olarak analiz edilmiş ve modelin karar alma süreci açıklanabilir hâle getirilmiştir. Özellikle bazı değişkenlerin enerji verimliliği üzerinde anlamlı etkiler yarattığı görülmüş, bu ilişkiler SHAP özet ve bağımlılık grafikleri ile görselleştirilmiştir. Ayrıca enerji verimliliği sadece sürekli bir değişken olarak değil, belirli eşiklerle düşük, orta ve yüksek verimli birimler şeklinde sınıflandırılmış; bu sayede karar vericilere yönelik daha uygulanabilir içgörüler sunulmuştur. Sınıf dağılımı grafikleri ve başarı skorları da bu yaklaşımın karar destek sistemlerine katkı potansiyelini ortaya koymuştur.
Sonuç olarak bu çalışma, açıklanabilir yapay zeka tabanlı analizlerin, endüstriyel enerji verimliliği alanında nasıl etkili şekilde kullanılabileceğini göstermektedir. Hem sektör özelinde hem de yöntemsel olarak özgün bir katkı sunan bu çalışma, sürdürülebilir üretim ve enerji yönetimi hedefleri doğrultusunda önemli bir araç olma potansiyeli taşımaktadır.
Enerji verimliliği Sınıflandırma Random forest SHAP Kimya endüstrisi
Sakarya Uygulamalı Bilimler Üniversitesi
Bu tez çalışmasının her aşamasında bilgi ve deneyimiyle yol gösteren, desteğini hiçbir zaman esirgemeyen değerli danışmanım Dr. Öğr. Üyesi İlker DURSUN’a en içten teşekkürlerimi sunarım. Kendisinin akademik rehberliği ve motivasyonu, çalışmamın şekillenmesinde büyük rol oynamıştır.
This study aims to develop a prediction and classification model supported by an explainable artificial intelligence approach to improve energy efficiency in industrial production. The focus of the study is to understand the energy consumption behavior of production units and develop decision support systems based on these behaviors through analyses of open datasets obtained from production facilities in the chemical industry. In this context, the Foundational Industrial Energy Dataset, published by the OpenEI platform affiliated with the United States Department of Energy, was used, and production units in the chemical industry classified with the NAICS 325 code were included in the study.
The variables in the dataset include technical parameters directly related to production, such as unit type, fuel type, design capacity, and energy consumption. A metric representing the amount of energy consumed per unit capacity was derived as an energy efficiency indicator, and both regression and classification analyses were conducted based on this indicator. Random Forest Regressor and Linear Regression algorithms were used in the study, and model performance was evaluated using R² and MSE metrics. The Random Forest algorithm produced results more suitable for the data structure and demonstrated higher performance. Not only was the model's predictive success evaluated, but also the transparency and interpretability of the decisions. For this purpose, the SHAP method was used to numerically analyze the impact of each production variable on the model results, and the model's decision-making process was explained. Specifically, some variables were found to have significant effects on energy efficiency, and these relationships were visualized using SHAP summary and dependency graphs. Furthermore, energy efficiency was classified not only as a continuous variable but also into low, medium, and high-efficiency units with specific thresholds, providing more actionable insights for decision-makers. Class distribution graphs and success scores also demonstrated the potential of this approach to contribute to decision support systems.
In conclusion, this study demonstrates how explainable AI-based analyses can be effectively used in the field of industrial energy efficiency. This study, which offers an original contribution both sector-specifically and methodologically, has the potential to be an important tool for achieving sustainable production and energy management goals.
Energy efficiency Classification Random forest SHAP Chemical industry
Sakarya University of Applied Sciences
I would like to express my sincere gratitude to my esteemed advisor, Dr. İlker DURSUN, for his unwavering support and guidance with his knowledge and experience throughout every stage of this thesis. His academic guidance and motivation played a significant role in shaping my work.
| Birincil Dil | Türkçe |
|---|---|
| Konular | Modelleme ve Simülasyon |
| Bölüm | Araştırma Makalesi |
| Yazarlar | |
| Gönderilme Tarihi | 18 Temmuz 2025 |
| Kabul Tarihi | 24 Ekim 2025 |
| Yayımlanma Tarihi | 18 Aralık 2025 |
| Yayımlandığı Sayı | Yıl 2025 Cilt: 6 Sayı: 2 |