Recommender systems have been popularly applied in various domains such as e-commerce, tourism, movie, music, and restaurants in recent years. Although researchers have introduced various algorithms, collaborative filtering is one of the most widely used algorithms in recommender systems. Collaborative filtering aims to recommend items that users might like in the future by taking into consideration the past preferences of users. In existing single criteria systems, users are expected to give a single rating about the items. However, a single criterion may not reflect the user's opinion. Thus, multi-criteria collaborative filtering systems have been introduced. Multiple criteria rating instead of a single criterion can increase the accuracy of future recommendations especially in domains such as movies, hotels, and restaurants. The first step in multi-criteria collaborative filtering systems is to find users or items similar to a user who asks for a recommendation. There are similarity-based methods commonly used in the literature to calculate similarity. While calculating the similarity in these methods, the ones that are co-rated between users / items are used. Although the number of co-rated items / users is very small, the correlation between them might be calculated very high. High correlation values may not always guarantee the best neighbors. Given these disadvantages, high correlation values might prevent reliable and accurate predictions. We propose to improve existing similarity calculations in order to increase performance in similarity-based approaches in multi-criteria item-based collaborative filtering. As the number of common users rating two items increases, the similarity calculated between them becomes more reliable. Therefore, it is recommended to use Jaccard and significance-weighting methods used in traditional collaborative filtering as weighting methods in the similarity calculation process in multi-criteria systems. With the proposed weighting methods, the aim is to decrease the calculated similarity as the number of users who rated both items decreases. Weighting methods are integrated into existing similarity calculation processes and it is aimed to increase neighbor selection and prediction performance. The proposed methods have been tested using three different versions of the Yahoo!Movies dataset. Experiments show that the proposed methods have greatly improved the prediction performance and coverage values compared to existing methods.
Multi-criteria Collaborative filtering Significance-weighting Jaccard similarity Item-based
Öneri sistemleri son yıllarda e-ticaret, turizm, film, müzik ve restoran gibi çeşitli alanlarda popüler olarak uygulanmaya başlanmıştır. Araştırmacılar çeşitli algoritmalar geliştirmelerine rağmen işbirlikçi filtreleme öneri sistemlerinde en yaygın kullanılan algoritmalardan biridir. İşbirlikçi filtreleme ile kullanıcıların geçmiş tercihleri göz önünde bulundurularak gelecekte kullanıcıların beğenebileceği ürünleri önermesi hedeflenir. Mevcut tek kriterli sistemlerde kullanıcıların ürünler hakkında tek bir derecelendirme vermesi beklenir. Fakat tek bir kriter kullanıcının ürünler hakkında fikrini yansıtmayabilir. Bu nedenle çok kriterli işbirlikçi filtreleme sistemleri geliştirilmiştir. Özellikle film, otel ve restoran gibi alanlarda kullanıcılar tek bir kritere göre derecelendirme vermek yerine birden çok kritere göre beğenilerini sunmaları onlara gelecekte yeni ürünler önermekteki başarıyı arttırabilir. Çok kriterli işbirlikçi filtreleme sistemlerindeki ilk aşama öneri isteyen bir kullanıcıya benzer en yakın kullanıcıları veya ürünleri bulmaktır. Literatürde benzerlik hesaplamak için yaygın kullanılan benzerlik-tabanlı metotlar mevcuttur. Bu metotlarda benzerlik hesaplanırken kullanıcılar / ürünler arasında ortak derecelendirilen ürünlerin / kullanıcıların verileri kullanılır. Fakat ortak derecelendirilen ürünlerin / kullanıcıların sayısı çok az olmasına rağmen aralarındaki korelasyon çok yüksek hesaplanabilir. Yüksek korelasyon değerleri her zaman en iyi komşular olduğunu garanti etmeyebilir. Bu dezavantajlar göz önüne alındığında yüksek korelasyon değerleri her zaman güvenilir ve doğru tahminler elde edilmesini engelleyebilir. Makalemizde çok kriterli ürün-tabanlı işbirlikçi filtrelemede benzerlik tabanlı yaklaşımlardaki performans artışını sağlamak için mevcut benzerlik hesaplamalarını iyileştirmeyi hedefliyoruz. İki ürünü oylayan ortak kullanıcı sayısı arttıkça, iki ürün arasında hesaplanan benzerlikte daha güvenilir olacaktır. Bu nedenle, geleneksel işbirlikçi filtrelemede kullanılan Jaccard ve önem ağırlıklandırma yöntemlerini çok kriterli sistemlerde benzerlik hesaplama sürecinde ağırlıklandırma yöntemleri olarak kullanılması önerilir. Önerilen ağırlıklandırma yöntemleri ile amaç, her iki ürünü de derecelendirme veren kullanıcı sayısı azaldıkça hesaplanan benzerliği azaltmaktır. Ağırlıklandırma yöntemleri, mevcut benzerlik hesaplama işlemlerine entegre edilerek komşu seçimi ve tahmin performansı arttırılması hedeflenir. Önerilen yöntemler Yahoo!Movies veri setinin üç farklı versiyonu kullanılarak test edilmiştir. Yapılan deneyler gösteriyor ki, önerilen metotlar mevcut metotlara göre tahmin performansını ve kapsam değerlerini büyük oranda arttırmıştır.
Primary Language | Turkish |
---|---|
Subjects | Engineering |
Journal Section | Articles |
Authors | |
Publication Date | August 15, 2020 |
Published in Issue | Year 2020 Ejosat Special Issue 2020 (HORA) |