Günümüzde aktif olarak kullanılan Üretken Çekişmeli Ağlar (GAN'lar), makine öğrenmesi ve yapay zeka alanlarında son teknoloji yöntemlerden biridir. GAN'lar, iki sinir ağının (Üretici ve Ayırt Edici) rekabetçi bir şekilde birbirlerini eğiterek yüksek karmaşıklıktaki veri örneklerini işlemelerine ve bu sayede gerçekçi yapay görüntüler, sesler veya videolar üretmelerine olanak tanır. Genel olarak GAN algoritması kullanan modeller, rastgele gürültü örnekleri ile rastgele sonuçlar üretmektedir. Ancak, bu çalışmada geliştirilen farklı bir GAN modeli, belirli koşullara uygun olarak modifiye edilmesi istenen hedef yüzlerin gerçekçi sonuçlar oluşturmasına odaklanmaktadır. Bu modelin tasarımında, hedef yüz verileri girdi olarak kullanılarak, bu yüzlerin istenilen özelliklere göre (örneğin, sakal ekleme, kellik, vb.) modifiye edilmesi sağlanmıştır. Deneysel sonuçlar, belirli koşullar altında üretilen çıktının kayda değer başarılar elde ettiğini göstermiştir. Özellikle, geriye yönelik bir eğitim süreci olmamasına rağmen, modelin çıktısı giriş olarak tekrar kullanıldığında, eski fotoğrafın yeniden oluşturulmasında %62 başarı elde edilmiştir. Ayrıca, fotoğrafların arka planı silinerek sadece yüz için yapılan hesaplamalar sonucunda bu başarı oranı ortalama %85'e yükselmiştir. Bu çalışma, GAN modellerinin sadece rastgele gürültü ile sonuç üretmekten öte, belirli koşullara uygun gerçekçi modifikasyonlar yapabilme potansiyelini göstermektedir. Ulaşılan bu başarı oranları, özellikle güvenlik sistemleri, estetik cerrahi, film endüstrisi ve bilgisayar yaratıcılığı gibi alanlarda GAN modellerinin kullanım potansiyelini artırmaktadır.
Generative Adversarial Networks (GANs) are among the state-of-the-art methods in the fields of machine learning and artificial intelligence. GANs enable the processing of highly complex data samples and thus the generation of realistic artificial images, sounds, or videos through the competitive training of two neural networks: the Generator and the Discriminator. Typically, models using the GAN algorithm produce random results with random noise samples. However, in this study, a different GAN model was developed, focusing on generating realistic results for target faces to be modified according to certain conditions. In the design of this model, target face data were used as input, and modifications (e.g., adding a beard, balding, etc.) were made according to desired characteristics. Experimental results showed that the outputs generated under certain conditions achieved remarkable success. Notably, even without a retrospective training process, the model achieved a 62% success rate in reconstructing the old photograph when the model’s output was reused as input. Additionally, when the background of the photos was removed and calculations were performed only on the face, this success rate increased to an average of 85%. This study demonstrates the potential of GAN models to perform realistic modifications according to specific conditions, beyond merely producing results with random noise. The achieved success rates highlight the potential applications of GAN models in fields such as security systems, aesthetic surgery, the film industry, and computer creativity.
Primary Language | Turkish |
---|---|
Subjects | Computer Software |
Journal Section | Articles |
Authors | |
Publication Date | June 18, 2024 |
Published in Issue | Year 2024 Volume: 14 Issue: 2 |
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.