Araştırma Makalesi

Metin Benzerliği Algoritmaları ile Veri Tekilleştirme: Oteller Veri Tabanında Bir Uygulama

Cilt: 14 Sayı: 2 22 Aralık 2021
PDF İndir

Metin Benzerliği Algoritmaları ile Veri Tekilleştirme: Oteller Veri Tabanında Bir Uygulama

Öz

Hızla ve kontrolsüzce artan veri dünyasında, veri tekilleştirme büyük bir ihtiyaçtır. Veri tekilleştirme, veri tabanında yinelenen verilerin kopyalarını ortadan kaldırmak ya da onları tespit ederek, eşsiz kimlik numarası ile betimlemek için kullanılan bir tekniktir. Oteller veri tabanında; ismi, adresi, acente bilgisi, ve fiyat bilgisi bulunan bir otelin, kayıtlarda farklı isim ve kimlik numaları ile bulunması, karşılaştırma olanağı sunmamaktadır. Rakip analizinin tam anlamıyla yapılabilmesi, rakip fiyat durumlarının bilinmesi ve pazar takibi bütün bu otel isimlerinin tekilleştirilmesi ile mümkündür. Bu çalışmanın amacı, otel isimlerini eşleştirerek, eş olan otelleri tek bir kimlik numarası ile tanımlamak ve tekil veriyi elde etmektir. Veri tekilleştirme için çeşitli metin benzerliği algoritmaları kullanılır. Bu çalışmada, Metin Benzerliği algoritmaları otel isimleri üzerinden karşılaştırılmıştır. Mesafe düzenleme bazlı benzerlik, belirteç bazlı benzerlik, diziliş tabanlı benzerlik algoritmaları ile bulanık dize eşleme algoritmaları incelenmiştir. Çalışmanın sonucunda Bulanık dize eşleme algoritmasının ve Jaro Winkler mesafesinin birlikte kullanıldığı hibrit bir model önerilmiştir.

Anahtar Kelimeler

Destekleyen Kurum

TUBİTAK

Proje Numarası

3192318

Teşekkür

Bu çalışma, TUBİTAK tarafından desteklenen TEYDEB 3192318 numaralı, Yapay Zeka İle Çoklu Tedarikçi Yapılarında, Otellerin Ve Oda Tiplerinin Eşleştirilmesi projesinden oluşturulmuştur. Desteği için TUBİTAK’a teşekkür ederiz.

Kaynakça

  1. S. Kemp, «we are social - Dıgıtal 2021: The Latest Insıghts Into The ‘State Of Dıgıtal,» January, New York, 2021.
  2. S. Karacan ve S. Çiftçioğlu, «TURİZM İŞLETMELERİNDE ELEKTRONİK TİCARETİN ETKİSİ,» Uluslararası Turizm, İşletme, Ekonomi Dergisi, pp. 245-252, 2018.
  3. Türkiye Otelciler Birliği, «Türkiye Otelciler Birliği,» 2 March 2021. [Çevrimiçi]. Available: http://www.turob.com/tr/istatistikler/hotrec-2020-online-dagitim-kanallari-calismasi.
  4. M. Pullman ve S. Rodgers, «Capacity management for hospitality and tourism: A review of current approaches,» International Journal of Hospitality Management , cilt 29(1), p. 177–187, 2010.
  5. S. Niwattanakul, J. Singthongchai, E. Naenudorn ve S. Wanapu, «Using of Jaccard Coefficient for Keywords,» Proceedings of the International MultiConference of Engineers and Computer Scientists, cilt 1, 2013.
  6. J. M. Duarte, J. B. d. Santos ve L. C. Melo, «Comparıson Of Sımılarıty Coeffıcıents Based On Rapd,» Genetics and Molecular Biology, cilt 22, no. 3, pp. 427-432, 1999.
  7. X. Jin, S. Zhang, J. Liu ve H. Guan, «Research on Similarity Detection of Massive Text based on Semantic Fingerprint,» Proceedings of Science, 2017.
  8. G. Chen, G. Chen, D. Wu, Q. Liu, L. Zhang ve X. Fan, «An improved Simhash algorithm based malicious mirror website detection method,» Journal of Physics: Conference Series, 2021.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Mühendislik

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

22 Aralık 2021

Gönderilme Tarihi

22 Eylül 2021

Kabul Tarihi

7 Kasım 2021

Yayımlandığı Sayı

Yıl 2021 Cilt: 14 Sayı: 2

Kaynak Göster

APA
Keleş, Ü., & Duru, N. (2021). Metin Benzerliği Algoritmaları ile Veri Tekilleştirme: Oteller Veri Tabanında Bir Uygulama. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 14(2), 86-98. https://doi.org/10.54525/tbbmd.998983
AMA
1.Keleş Ü, Duru N. Metin Benzerliği Algoritmaları ile Veri Tekilleştirme: Oteller Veri Tabanında Bir Uygulama. TBV-BBMD. 2021;14(2):86-98. doi:10.54525/tbbmd.998983
Chicago
Keleş, Ünzüle, ve Nevcihan Duru. 2021. “Metin Benzerliği Algoritmaları ile Veri Tekilleştirme: Oteller Veri Tabanında Bir Uygulama”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 14 (2): 86-98. https://doi.org/10.54525/tbbmd.998983.
EndNote
Keleş Ü, Duru N (01 Aralık 2021) Metin Benzerliği Algoritmaları ile Veri Tekilleştirme: Oteller Veri Tabanında Bir Uygulama. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 14 2 86–98.
IEEE
[1]Ü. Keleş ve N. Duru, “Metin Benzerliği Algoritmaları ile Veri Tekilleştirme: Oteller Veri Tabanında Bir Uygulama”, TBV-BBMD, c. 14, sy 2, ss. 86–98, Ara. 2021, doi: 10.54525/tbbmd.998983.
ISNAD
Keleş, Ünzüle - Duru, Nevcihan. “Metin Benzerliği Algoritmaları ile Veri Tekilleştirme: Oteller Veri Tabanında Bir Uygulama”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 14/2 (01 Aralık 2021): 86-98. https://doi.org/10.54525/tbbmd.998983.
JAMA
1.Keleş Ü, Duru N. Metin Benzerliği Algoritmaları ile Veri Tekilleştirme: Oteller Veri Tabanında Bir Uygulama. TBV-BBMD. 2021;14:86–98.
MLA
Keleş, Ünzüle, ve Nevcihan Duru. “Metin Benzerliği Algoritmaları ile Veri Tekilleştirme: Oteller Veri Tabanında Bir Uygulama”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, c. 14, sy 2, Aralık 2021, ss. 86-98, doi:10.54525/tbbmd.998983.
Vancouver
1.Ünzüle Keleş, Nevcihan Duru. Metin Benzerliği Algoritmaları ile Veri Tekilleştirme: Oteller Veri Tabanında Bir Uygulama. TBV-BBMD. 01 Aralık 2021;14(2):86-98. doi:10.54525/tbbmd.998983

Cited By

https://i.creativecommons.org/l/by-nc/4.0Makale Kabulü

 

Çevrimiçi makale yüklemesi yapmak için kullanıcı kayıt/girişini kullanınız.

Dergiye gönderilen makalelerin kabul süreci şu aşamalardan oluşmaktadır:

1.       Gönderilen her makale ilk aşamada en az iki hakeme gönderilmektedir.

2.       Hakem ataması, dergi editörleri tarafından yapılmaktadır. Derginin hakem havuzunda yaklaşık 200 hakem bulunmaktadır ve bu hakemler ilgi alanlarına göre sınıflandırılmıştır. Her hakeme ilgilendiği konuda makale gönderilmektedir. Hakem seçimi menfaat çatışmasına neden olmayacak biçimde yapılmaktadır.

3.       Hakemlere gönderilen makalelerde yazar adları kapatılmaktadır.

4.       Hakemlere bir makalenin nasıl değerlendirileceği açıklanmaktadır ve aşağıda görülen değerlendirme formunu doldurmaları istenmektedir.

5.       İki hakemin olumlu görüş bildirdiği makaleler editörler tarafından benzerlik incelemesinden geçirilir. Makalelerdeki benzerliğin %25’ten küçük olması beklenir.

6.       Tüm aşamaları geçmiş olan bir bildiri dil ve sunuş açısından editör tarafından incelenir ve gerekli düzeltme ve iyileştirmeler yapılır. Gerekirse yazarlara durum bildirilir.

 88x31.png   Bu eser Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı ile lisanslanmıştır.