Research Article

Netflix verileri üzerinde TF-IDF algoritması ve Kosinüs benzerliği ile bir İçerik Öneri Sistemi Uygulaması

Volume: 13 Number: 48 February 28, 2022
EN TR

Netflix verileri üzerinde TF-IDF algoritması ve Kosinüs benzerliği ile bir İçerik Öneri Sistemi Uygulaması

Abstract

Günümüzde kullanıcılar dijital platformlarda kullanılan çevrimiçi içerik sitelerinde bulunan içeriklerde arama yapmak, bulmak ve bunları zaman ve mekan bağımsız olarak tüketmek istemektedirler. İnternet üzerinden yayın yapan bu platformlar arasında dünya çapında en yaygın olanlardan birisi de Netflix’tir. Bu çalışmanın amacı TF-IDF (term frequency–inverse document frequency) algoritması ve Kosinüs benzerliği ile Doğal Dil İşleme (NLP) ile Netflix kullanıcı verileri üzerinde bir içerik öneri sistemi uygulaması geliştirmektir. Bu bağlamda çalışmamızda yapılan analizler ile benzerlik yöntemleri ve uygun eşleşme verilerinin bulunması, böylelikle kullanıcılara kişisel bazda öneri yapılması hedeflenmiştir. Çalışma kapsamında hem Türkçe ve hem de diğer dillerdeki filmler ve diziler üzerinde farklı deneyler yapılmıştır. Yapılan deneyler neticesinde kosinüs benzerliği kullanılarak en yüksek benzerlik başarısı %91, en düşük benzerlik başarısı ise %43 olarak elde edilmiştir. Deneyler aynı veriler üzerinde TF-IDF algoritması ile yapıldığında ise başarı oranı %99 ile %80 arasında elde edilmiştir. Çalışma sonuçları, TF-IDF algoritması ile yapılan deneylerde, kosinüs benzerliği kullanılarak yapılan deneylere nazaran daha yüksek başarı oranının elde edildiğini ortaya koymaktadır. Çalışmamızın benzerlik yöntemleri ve uygun eşleşme verileri kullanılarak kişisel bazda öneri yapmayı hedefleyen içerik tabanlı öneri sistemi uygulamalarının geliştirilmesi bağlamında literatüre katkı sağlayacağı değerlendirilmektedir.

Keywords

References

  1. Ahmad, S. (2017). Survey on recommendation system using data mining and clustering techniques. International Journal for Research in Engineering Application and Management (IJREAM), 3(9), 68-72.
  2. Ahmed, H., Traore, I., & Saad, S. (2017). Detection of online fake news using n-gram analysis and machine learning techniques. In International conference on intelligent, secure, and dependable systems in distributed and cloud environments (pp. 127-138). Springer, Cham.
  3. Akay, E. C., Soydan, N. T. Y., & Gacar, B. K. (2020). Makine öğrenmesi ve ekonomi: bibliyometrik analiz. PressAcademia Procedia, 12(1), 104-105.
  4. Albayrak, A. (2020). Doğal Dil İşleme Teknikleri Kullanılarak Disiplinler Arası Lisansüstü Ders İçeriği Hazırlanması. Bilişim Teknolojileri Dergisi, 13(4), 373-383.
  5. Al-Rimy, B. A. S., Maarof, M. A., Alazab, M., Alsolami, F., Shaid, S. Z. M., Ghaleb, F. A., ... & Ali, A. M. (2020). A pseudo feedback-based annotated TF-IDF technique for dynamic crypto-ransomware pre-encryption boundary delineation and features extraction. IEEE Access, 8, 140586-140598.
  6. Amin, D. M., & Garg, A. (2019). Performance Analysis of Data Mining Algorithms. Journal of Computational and Theoretical Nanoscience, 16(9), 3849-3853.
  7. Bansal S., (2021). Netflix Movies and TV Shows, https://www.kaggle.com/shivamb/netflix-shows
  8. Başer, B. Ö., Yangın, M., Sarıdaş, E. S. (2021). Makine Öğrenmesi Teknikleriyle Diyabet Hastalığının Sınıflandırılması. Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi, 25(1), 112-120.

Details

Primary Language

Turkish

Subjects

-

Journal Section

Research Article

Publication Date

February 28, 2022

Submission Date

October 20, 2021

Acceptance Date

January 29, 2022

Published in Issue

Year 2022 Volume: 13 Number: 48

APA
Gelemet, Ö., Aydın, H., & Çetinkaya, A. (2022). Netflix verileri üzerinde TF-IDF algoritması ve Kosinüs benzerliği ile bir İçerik Öneri Sistemi Uygulaması. AJIT-E: Academic Journal of Information Technology, 13(48), 31-52. https://doi.org/10.5824/ajite.2022.01.002.x
AMA
1.Gelemet Ö, Aydın H, Çetinkaya A. Netflix verileri üzerinde TF-IDF algoritması ve Kosinüs benzerliği ile bir İçerik Öneri Sistemi Uygulaması. AJIT-e: Academic Journal of Information Technology. 2022;13(48):31-52. doi:10.5824/ajite.2022.01.002.x
Chicago
Gelemet, Özlem, Hakan Aydın, and Ali Çetinkaya. 2022. “Netflix Verileri üzerinde TF-IDF Algoritması Ve Kosinüs Benzerliği Ile Bir İçerik Öneri Sistemi Uygulaması”. AJIT-E: Academic Journal of Information Technology 13 (48): 31-52. https://doi.org/10.5824/ajite.2022.01.002.x.
EndNote
Gelemet Ö, Aydın H, Çetinkaya A (February 1, 2022) Netflix verileri üzerinde TF-IDF algoritması ve Kosinüs benzerliği ile bir İçerik Öneri Sistemi Uygulaması. AJIT-e: Academic Journal of Information Technology 13 48 31–52.
IEEE
[1]Ö. Gelemet, H. Aydın, and A. Çetinkaya, “Netflix verileri üzerinde TF-IDF algoritması ve Kosinüs benzerliği ile bir İçerik Öneri Sistemi Uygulaması”, AJIT-e: Academic Journal of Information Technology, vol. 13, no. 48, pp. 31–52, Feb. 2022, doi: 10.5824/ajite.2022.01.002.x.
ISNAD
Gelemet, Özlem - Aydın, Hakan - Çetinkaya, Ali. “Netflix Verileri üzerinde TF-IDF Algoritması Ve Kosinüs Benzerliği Ile Bir İçerik Öneri Sistemi Uygulaması”. AJIT-e: Academic Journal of Information Technology 13/48 (February 1, 2022): 31-52. https://doi.org/10.5824/ajite.2022.01.002.x.
JAMA
1.Gelemet Ö, Aydın H, Çetinkaya A. Netflix verileri üzerinde TF-IDF algoritması ve Kosinüs benzerliği ile bir İçerik Öneri Sistemi Uygulaması. AJIT-e: Academic Journal of Information Technology. 2022;13:31–52.
MLA
Gelemet, Özlem, et al. “Netflix Verileri üzerinde TF-IDF Algoritması Ve Kosinüs Benzerliği Ile Bir İçerik Öneri Sistemi Uygulaması”. AJIT-E: Academic Journal of Information Technology, vol. 13, no. 48, Feb. 2022, pp. 31-52, doi:10.5824/ajite.2022.01.002.x.
Vancouver
1.Özlem Gelemet, Hakan Aydın, Ali Çetinkaya. Netflix verileri üzerinde TF-IDF algoritması ve Kosinüs benzerliği ile bir İçerik Öneri Sistemi Uygulaması. AJIT-e: Academic Journal of Information Technology. 2022 Feb. 1;13(48):31-52. doi:10.5824/ajite.2022.01.002.x