Gözlenebilirlik, bir sistemin iç durumlarının, çıktılarına bakılarak tahmin edilme derecesini ifade eder. Bir sistemin gözlenebilir olması, o sistemin tüm iç durumlarının dışarıdan alınan ölçümlerle tam olarak belirlenebilmesini sağlar. Uygulama, altyapı ve ağ gözlenebilirliği, kontrol teorisi ve otomatik kontrol sistemleri tasarımında kritik bir rol oynar. Bu özellik, sistemin kontrol edilip edilemeyeceğini belirler. Bu çalışmada, tüm teknoloji katmanlarının performansını olumsuz etkileyen olayları ve standart dışı durumları anlamak ve eyleme dönüştürülebilir akıllı bildiriler sağlamak için uygulama, altyapı ve ağ gibi sistemlerin gözlenebilirlik verilerini tek bir platform aracılığıyla toplayan, anlık gözlenmesini, ilişkilendirilmesini, standartlaştırılmasını ve analiz edilmesini sağlayan bir platform geliştirilmiştir. Bu sayede, kullanılan birden fazla alternatif ve sadece kısmi işlev gören platformlar yerine, tek bir platform ile tüm gözlenebilirlik ihtiyaçları karşılanmış ve bütünleşik bir gözlenebilirlik deneyimi sunulmuştur. Platform kapsamında, çeşitli sistemlerden ilgili telemetri (log, metrik, iz, olay) verilerini alan, kaydedip saklayan, görselleştirip raporlanmasını sağlayan, belli durumlarda alarm üreten, akıllı alarm yöntemleri ile destekleyen, bir sorunun temel nedenini belirlemek ve çözmek amacıyla kullanılan bir yaklaşım olan kök neden analizi ile sorunların kök nedenlerini kolayca bulmayı sağlayan araçlar, web servisleri, kullanıcı arayüzleri ve makine öğrenme modelleri geliştirilmiştir. Bu platform, kullanıcılarına bütünleşik bir gözlenebilirlik çözümü sunmaktadır. Ayrıca, geliştirilen platform ile gözlenebilirlik platformu kullanıcı sayısının %30 arttığı gözlenmiştir.
Observability refers to the degree to which the internal states of a system can be predicted by looking at its outputs. The observability of a system ensures that all internal states of that system can be precisely determined by external measurements. Application, infrastructure and network observability plays a critical role in control theory and automatic control systems design. This feature determines whether the system can be controlled or not. In this study, a platform has been developed that collects observability data of systems such as applications, infrastructure and networks through a single platform and enables instant observation, association, standardization and analysis in order to understand events and non-standard situations that negatively affect the performance of all technology layers and to provide actionable smart notifications. In this way, instead of using multiple alternatives and only partially functional platforms, all observability needs are met with a single platform and an integrated observability experience is offered. Within the scope of the platform, it is an approach that receives relevant telemetry (log, metric, trace, event) data from various systems, records and stores it, visualizes and reports it, generates alarms in certain situations, supports it with smart alarm methods, and is used to determine and solve the root cause of a problem. Tools, web services, user interfaces and machine learning models have been developed to easily find the root causes of problems through cause analysis. This platform offers its users an integrated observability solution. Additionally, it has been observed that the number of observability platform users increased by 30% with the developed platform.
| Primary Language | Turkish | 
|---|---|
| Subjects | Electrical Engineering (Other) | 
| Journal Section | Research Paper | 
| Authors | |
| Early Pub Date | July 19, 2024 | 
| Publication Date | August 20, 2024 | 
| Submission Date | July 12, 2024 | 
| Acceptance Date | July 19, 2024 | 
| Published in Issue | Year 2024 Volume: 6 Issue: 1 |