Bilgi çağı olan günümüzde veri, özellikle teknolojinin hızla ilerlemesiyle birçok alanda kritik bir kaynak hâline gelmiştir. Veri doğru bir şekilde toplandığında, düzenlendiğinde ve analiz edildiğinde birçok sektörde etkili kararlar almak, süreçleri iyileştirmek ve başarı elde etmek için güçlü bir araç hâline gelir. Gerçek verinin kısıtlılığı, etiketlenmiş verinin elde edilmesinin maliyetli olması, bazı durumlarda ve alanlarda gizlilik ve güvenlik endişeleri gibi sebepler sentetik verilere ihtiyaç duyulmasına sebep olmuştur. Sentetik veriler, özellikle sağlık alanında hassaslık ve gizlilik endişeleri, yasal düzenlemeler, etik ve güvenliğin sağlanmaya çalışılması gibi nedenlerden dolayı önemli bir araçtır. Sentetik veri üretme amacıyla Derin Öğrenme (DÖ) modeli olan ÇÜA (Çekişmeli Üretici Ağlar) ortaya çıkmıştır. Bu çalışmada Meme Histopatoloji veri seti kullanılarak bir ÇÜA çeşidi olan ÇÖD-ÇÜA (Üretken Rekabetçi Ağlar için Çok Ölçekli Değişimler) ile kanser tespitinde yarar sağlamak amacıyla kötü huylu ve iyi huylu etiketli sentetik yama görselleri oluşturulmuştur. Sonrasında gerçek ve sentetik veriler ResNet18 modeli kullanılarak Aktarımlı Öğrenme ile dört farklı şekilde sınıflandırılmıştır. İlk sınıflandırmada gerçek veriler eğitim ve test verisi olarak kullanılıp %84 doğruluk oranı, ikinci sınıflandırmada sentetik veriler eğitim ve test verisi olarak kullanılıp %99 doğruluk oranı, üçüncü sınıflandırmada gerçek veriler eğitim, sentetik veriler test verisi olarak kullanılıp %81 doğruluk oranı, dördüncü sınıflandırmada sentetik veriler eğitim, gerçek veriler test verisi olarak kullanılıp %76 doğruluk oranı elde edilmiştir. Çalışma sonucunda dört farklı sınıflandırma ilişkilendirilerek sentetik görüntülerin orijinal verilere olan benzerliği ve gerçek veri gibi davranıp davranmadığı tespit edilmeye çalışılmıştır.
Çekişmeli üretici ağlar histopatoloji ÇÖD-ÇÜA ResNet18 sentetik veri
Since technology is advancing so quickly in the modern era of information, data is becoming an essential resource in many fields. Correct data collection, organization, and analysis make it a potent tool for successful decision-making, process improvement, and success across a wide range of sectors. Synthetic data is required for a number of reasons, including the constraints of real data, the expense of collecting labeled data, and privacy and security problems in specific situations and domains. For a variety of reasons, including security, ethics, legal restrictions, sensitivity and privacy issues, and ethics, synthetic data is a valuable tool, particularly in the health sector. A Deep Learning (DL) model called GAN (Generative Adversarial Networks) has been developed with the intention of generating synthetic data. In this study, the Breast Histopathology dataset was used to generate malignant and benign labeled synthetic patch images using MSG-GAN (Multi-Scale Gradients for Generative Adversarial Networks), a form of GAN, to aid in cancer identification. After that, real and synthetic data were classified in four different ways with Transfer Learning (TL) using the ResNet18 model. In the first classification, real data is used as training and test data and an accuracy rate of 84%, in the second classification, synthetic data is used as training and test data and the accuracy rate is 99%, in the third classification, real data is used as training and synthetic data is used as test data and an accuracy rate of 81%, in the fourth classification, synthetic data is used as training and real data is used as test data and an accuracy rate of 76%. As a result of the study, four different classifications were associated and it was tried to determine whether the synthetic images are similar to the original data and whether they behave like real data.
Generative adversarial networks histopathology MSG-GAN ResNet18 synthetic data
Birincil Dil | İngilizce |
---|---|
Konular | Bilgisayar Yazılımı |
Bölüm | Araştırma Makaleleri |
Yazarlar | |
Yayımlanma Tarihi | 25 Kasım 2024 |
Gönderilme Tarihi | 27 Mayıs 2024 |
Kabul Tarihi | 15 Eylül 2024 |
Yayımlandığı Sayı | Yıl 2024 Cilt: 14 Sayı: 3 |