Natural Language Processing (NLP) has emerged remarkable progress in the field of deep learning studies. Not only a superior alternative to rule-based NLP methods, deep learning-based techniques have also succeeded more accurate performances in various NLP tasks such as text classification, sentiment analysis or document clustering. Since the performance of a deep learning model undoubtedly depends on adjusting its hyperparameters ideally, tuning the most optimum hyperparameters determines the capability of the model learning in terms of meaningful pattern extraction from the input data. In this paper, hyperparameter optimization techniques of Bayesian Optimization, Random Search and Grid Search have been applied on the deep learning models of Long Short-Term Memory (LSTM) and Convolutional Neural Network (CNN) for the purpose of detecting defective expressions in Turkish sentences. The hyperparameters of previously implemented LSTM and CNN models for this purpose have been adjusted using trial-and-error approach, which is time-consuming and cannot guarantee the most ideal model in general. After these hyperparameters have been adjusted using optimization techniques, the performances in terms of accuracy have been increased from 87.94% to 92.82% and from 84.33% to 89.79% for the models of LSTM and CNN respectively.
Bayesian optimization Grid search Hyperparameter optimization NLP Random search Turkish
Doğal Dil İşleme (DDİ), derin öğrenme çalışmaları alanında dikkat çekici ilerlemeler ortaya koymuştur. Derin öğrenme tabanlı teknikler, yalnızca kural tabanlı DDİ yöntemlerine üstün bir alternatif olmakla kalmayıp, aynı zamanda metin sınıflandırma, duygu analizi veya belge kümeleme gibi çeşitli DDİ görevlerinde de daha doğru performanslar elde etmeyi başarmıştır. Bir derin öğrenme modelinin performansı, şüphesiz ki hiperparametrelerinin ideal şekilde ayarlanmasına bağlı olduğundan, en ideal hiperparametrelerin ayarlanması, girdi verilerinden anlamlı örüntü çıkarma açısından model öğrenmesinin kapasitesini belirler. Bu makalede, Türkçe cümlelerdeki anlatım bozukluklarını tespit etmek amacıyla Uzun Kısa-Süreli Bellek (UKSB) ve Evrişimsel Sinir Ağları (ESA) derin öğrenme modelleri üzerinde Bayesian Optimization, Random Search ve Grid Search hiperparametre optimizasyon teknikleri uygulanmıştır. Bu amaçla daha önce geliştirilmiş UKSB ve ESA modellerinin hiperparametreleri, zaman alan ve genel olarak en ideal modeli garanti edemeyen deneme-yanılma yaklaşımı kullanılarak ayarlanmıştı. Bu hiperparametreler, optimizasyon teknikleri kullanılarak ayarlandıktan sonra ise, doğruluk açısından performansları UKSB ve ESA modelleri için sırasıyla %87,94'ten %92,82'ye ve %84,33'ten %89,79'a yükseltilmiştir.
Bayesian optimization Grid search Hiperparametre optimizasyonu Doğal dil işleme Random search Türkçe
Birincil Dil | İngilizce |
---|---|
Konular | Performans Değerlendirmesi, Yüksek Performanslı Hesaplama |
Bölüm | Araştırma Makalesi |
Yazarlar | |
Erken Görünüm Tarihi | 15 Ocak 2025 |
Yayımlanma Tarihi | |
Gönderilme Tarihi | 11 Mart 2024 |
Kabul Tarihi | 16 Nisan 2024 |
Yayımlandığı Sayı | Yıl 2025 Cilt: 27 Sayı: 79 |
Dokuz Eylül Üniversitesi, Mühendislik Fakültesi Dekanlığı Tınaztepe Yerleşkesi, Adatepe Mah. Doğuş Cad. No: 207-I / 35390 Buca-İZMİR.