ÖZET: Bu çalışmada, görüntü işleme, sinyal işleme, doğal dil işleme ve
konuşma tanıma gibi makine öğrenmesi konularındaki problemlerin
çözümünde son yıllarda büyük doğruluk oranı ve hız ile kendinden çokça
söz ettiren derin öğrenme kullanılarak görüntü sınıflandırma işlemi
yapılmıştır. CIFAR-100 veri kümesinden seçilen 8 farklı görüntü seçilmiştir.
Bu görüntüler; otobüs, traktör, tren, dinozor, fil, kelebek, sandalye,
televizyondur. Her sınıf için toplamda eğitim ve test işlemleri için sırasıyla
800 ve 40 adet görüntü kullanıldı. Çalışmada, derin öğrenmenin özelleşmiş
bir yapısı olan evrişimsel sinir ağları(CNN) kullanıldı. CNN, katmanlı
yapısıyla gizli öznitelikleri çıkararak işlem yapmaktadır. Gizli katman
sayısının artışıbir noktaya kadar olumlu etki yaparken sonrasında
parametre artışından dolayı bulma hızını düşürdüğü için performansa
olumsuz yönde etki etmektedir. Biz çalışmamızda 7 katmanlı AlexNet benzeri
bir yapı kullandık. CNN’yi girdi olarak kabul eden birçok açık kaynak
yazılım bulunmaktadır. Bunlardan birisi olan caffe, c++, python ve matlab
gibi dillerle uyumlu olması ve çoğu ortamda uygulanabilmesinden dolayı
tercih edilmiştir. Önerilen yöntem, sınıflandırma konusunda evrişimsel sinir
ağlarının başarısını göstermektedir. Çalışmada ayrıca, derin öğrenme
teknikleri kullanılarak yapılmış var olan çalışmalar gösterilmiştir. Bu hızla
giderse derin öğrenme akademik ve bilim dünyasında, problemleri
çözmedeki başarısıyla adından söz ettirmeye devam edecek ve beklentileri
karşılayacaktır.
Evrişimsel sinir ağları görüntü sınıflandırma caffe CIFAR-100.
AbstractIn this work, it has been made image classification process using deep learning that often used with high accuracy rate and low working time about solving problems that belong to machine learning issues such as image processing, signal processing, natural language processing and speech recognition in recent years. Different eight images have been selected from CIFAR-100 dataset. This images are bus, tractor, train, dinosaurs, elephant, butterfly, chair and television. 800 and 40 images for each class in total were respectively used for training and test processes. In work, convolutional neural networks which is a specialized structure of deep learning was used. CNN works by removing hidden attributes thanks to its layered structure. Increasing the number of hidden layer makes a positive impact up to a point. After, it adversely affects performance due to reduce finding speed because of the increase of parameter. We used a AlexNet like structure which has 7 layers in our study. It is found many open source software that accepts CNN as input Caffe that is one of them has been preferred because of compatible with languages such as C++, Python, matlab etc. and applicable to most environments. Method which is recommended shows success of CNN about classification. Also, studies that are made using deep learning techniques have been showed in work. If deep learning improves in this way it will continue to be mentioned in the academic and scientific world, so it will meet expectations
Convolutional Neural Network image classification caffe CIFAR-100
Diğer ID | JA34YZ34VB |
---|---|
Bölüm | Araştırma Makalesi |
Yazarlar | |
Yayımlanma Tarihi | 1 Ağustos 2016 |
Yayımlandığı Sayı | Yıl 2016 Cilt: 6 Sayı: 2 |
All articles published by EJT are licensed under the Creative Commons Attribution 4.0 International License. This permits anyone to copy, redistribute, remix, transmit and adapt the work provided the original work and source is appropriately cited.