Recommendation systems are systems that predict future preferences of users based on their past preferences. However, users may not always indicate their preferences to the systems. This causes data sparseness, which is one of the biggest problems when designing recommender systems. Autoencoders from deep learning algorithms solve the data sparsity problem by re-populating the sparse user matrix based on insights learned from the data. In this study, performances of deep learning algorithms were compared against data sparsity by using four different autoencoder models, namely Vanilla Autoencoder, Denoising Autoencoder, Sparse Autoencoder and Variational Autoencoder. The MovieLens-100K dataset, which contains 93.6% sparse data, was used as the data set. It has been observed that automatic encoder models provide more successful results in item-based recommendation systems than user based recommendation systems. It has been observed that Vanilla Autoencoder provides better performance in item-based recommendation systems, while Vanilla Autoencoder and Sparse Autoencoder provide very close performance in user-based recommendation systems.
Recommendation System Deep Learning Autoencoder Data Sparsity
Öneri sistemleri kullanıcıların geçmişteki tercihlerinden hareketle gelecekteki tercihlerini tahmin eden sistemlerdir. Fakat kullanıcılar her zaman tercihlerini sistemlere belirtmeyebilir. Bu durum, öneri sistemleri tasarlanırken karşılaşılan en büyük sorunlardan biri olan veri seyrekliğine neden olur. Derin öğrenme algoritmalarından otomatik kodlayıcılar, seyrek kullanıcı matrisini verilerden öğrendiği iç görülerden hareketle yeniden doldurarak veri seyrekliği probleminin çözülmesini sağlar. Bu çalışmada derin öğrenme algoritmalarından Temel Otomatik Kodlayıcı, Gürültü Giderici Otomatik Kodlayıcı, Seyrek Otomatik Kodlayıcı ve Varyasyonel Otomatik Kodlayıcı olmak üzere dört farklı otomatik kodlayıcı modeli kullanılarak veri seyrekliğine karşı performansları karşılaştırılmıştır. Veri seti olarak %93,6 oranında seyrek veri içeren MovieLens-100K veri seti kullanılmıştır. Otomatik kodlayıcı modelleri öğe tabanlı öneri sistemlerinde kullanıcı tabanlı öneri sistemlerine göre daha başarılı sonuçlar sağladığı gözlemlenmiştir. Öğe tabanlı öneri sistemlerde Temel Otomatik Kodlayıcı daha iyi performans sağlarken, kullanıcı tabanlı öneri sistemlerinde ise Temel Otomatik Kodlayıcı ve Seyrek Otomatik Kodlayıcı birbirlerine çok yakın bir performans sağladıkları gözlemlenmiştir.
Öneri Sistemleri Derin Öğrenme Otomatik Kodlayıcılar Veri Seyrekliği
Birincil Dil | Türkçe |
---|---|
Konular | Yapay Zeka |
Bölüm | PAPERS |
Yazarlar | |
Yayımlanma Tarihi | 10 Ekim 2022 |
Gönderilme Tarihi | 10 Eylül 2022 |
Kabul Tarihi | 16 Eylül 2022 |
Yayımlandığı Sayı | Yıl 2022 Cilt: IDAP-2022 : International Artificial Intelligence and Data Processing Symposium |
The Creative Commons Attribution 4.0 International License is applied to all research papers published by JCS and
a Digital Object Identifier (DOI) is assigned for each published paper.