Olasılıksal Yöntemler ile Türkçe Metinlerin Anlamsal Benzerliğinin Belirlenmesi

Engin Yıldıztepe; Volkan Uzun

doi:10.33484/sinopfbd.350445

EN TR

Determination of the Semantic Similarity of Turkish Texts Using Probabilistic Methods

Öz

Text mining is the process to deriving useful information from unstructured text data. During this process, text mining uses statistical and mathematical methods. Major text mining tasks include text categorization, text clustering, concept extraction, document summarization, semantic similarity and author identification. In this study, semantic similarity issues have been examined. Semantic similarity analysis aims to determine semantic similarity between texts. Probabilistic latent semantic analysis and latent Dirichlet allocation are probabilistic methods to determine semantic similarity between texts. In this study, semantic analysis using probabilistic latent semantic analysis and latent Dirichlet allocation methods is examined. Also, an application which is conducted to analyze semantic similarity and classify Turkish textual data chosen from different news agencies is discussed. R statistical programming language and Matlab are used in the application.

Anahtar Kelimeler

Semantic similarity,Latent semantic analysis,Latent Dirichlet Allocation,Text mining

Kaynakça

Hoffman T, 2015. Unsupervised Learning by Probabilistic Latent Semantic Analysis. Machine Learning, 42: 177-196.
Deerwester S, Dumais ST, Furnas GW, Landauer TK, Harshman R, 1990. Indexing by latent semantic analysis. Journal of the American society for information science, 41(6): 391-407.
Blei DM, Ng AY, Jordan MI, 2003. Latent dirichlet allocation. Journal of Machine Learning Research, 3: 993-1022.
Dempster AP, Laird NM, Rubin, DB, 1977. Maximum likelihood from incomplete data via the EM algorithm. Journal of the royal statistical society: 1-38.
Zemberek NLP, http://zemberek-web.appspot.com/ [erişim 03/2014]
Hornik K, Grün B, 2011. topicmodels: An R package for fitting topic models. Journal of Statistical Software, 40 (13): 1-30.
Porter MF, 1980. An algorithm for suffix stripping. Program, 14 (3): 130-137

Ayrıntılar

Birincil Dil

Türkçe

Konular

Mühendislik

Bölüm

Araştırma Makalesi

Yazarlar

Engin Yıldıztepe
DOKUZ EYLÜL ÜNİVERSİTESİ, FEN FAKÜLTESİ, İSTATİSTİK BÖLÜMÜ
Türkiye

Volkan Uzun Bu kişi benim
Türkiye

Yayımlanma Tarihi

28 Aralık 2018

Gönderilme Tarihi

10 Kasım 2017

Kabul Tarihi

7 Aralık 2018

Yayımlandığı Sayı

Yıl 2018 Cilt: 3 Sayı: 2

DOI

https://doi.org/10.33484/sinopfbd.350445

IZ

https://izlik.org/JA28SJ59TY

Kaynak Göster

RIS / Bibtex

APA

Yıldıztepe, E., & Uzun, V. (2018). Olasılıksal Yöntemler ile Türkçe Metinlerin Anlamsal Benzerliğinin Belirlenmesi. Sinop Üniversitesi Fen Bilimleri Dergisi, 3(2), 66-78. https://doi.org/10.33484/sinopfbd.350445

AMA

1.Yıldıztepe E, Uzun V. Olasılıksal Yöntemler ile Türkçe Metinlerin Anlamsal Benzerliğinin Belirlenmesi. Sinopfbd. 2018;3(2):66-78. doi:10.33484/sinopfbd.350445

Chicago

Yıldıztepe, Engin, ve Volkan Uzun. 2018. “Olasılıksal Yöntemler ile Türkçe Metinlerin Anlamsal Benzerliğinin Belirlenmesi”. Sinop Üniversitesi Fen Bilimleri Dergisi 3 (2): 66-78. https://doi.org/10.33484/sinopfbd.350445.

EndNote

Yıldıztepe E, Uzun V (01 Aralık 2018) Olasılıksal Yöntemler ile Türkçe Metinlerin Anlamsal Benzerliğinin Belirlenmesi. Sinop Üniversitesi Fen Bilimleri Dergisi 3 2 66–78.

IEEE

[1]E. Yıldıztepe ve V. Uzun, “Olasılıksal Yöntemler ile Türkçe Metinlerin Anlamsal Benzerliğinin Belirlenmesi”, Sinopfbd, c. 3, sy 2, ss. 66–78, Ara. 2018, doi: 10.33484/sinopfbd.350445.

ISNAD

Yıldıztepe, Engin - Uzun, Volkan. “Olasılıksal Yöntemler ile Türkçe Metinlerin Anlamsal Benzerliğinin Belirlenmesi”. Sinop Üniversitesi Fen Bilimleri Dergisi 3/2 (01 Aralık 2018): 66-78. https://doi.org/10.33484/sinopfbd.350445.

JAMA

1.Yıldıztepe E, Uzun V. Olasılıksal Yöntemler ile Türkçe Metinlerin Anlamsal Benzerliğinin Belirlenmesi. Sinopfbd. 2018;3:66–78.

MLA

Yıldıztepe, Engin, ve Volkan Uzun. “Olasılıksal Yöntemler ile Türkçe Metinlerin Anlamsal Benzerliğinin Belirlenmesi”. Sinop Üniversitesi Fen Bilimleri Dergisi, c. 3, sy 2, Aralık 2018, ss. 66-78, doi:10.33484/sinopfbd.350445.

Vancouver

1.Engin Yıldıztepe, Volkan Uzun. Olasılıksal Yöntemler ile Türkçe Metinlerin Anlamsal Benzerliğinin Belirlenmesi. Sinopfbd. 01 Aralık 2018;3(2):66-78. doi:10.33484/sinopfbd.350445

Cited By

Sosyal Medya Platformu Üzerinde Gizli Anlam Analizi

European Journal of Science and Technology

https://doi.org/10.31590/ejosat.590521

https://doi.org/

A Turkish Dataset and BERTurk-Contrastive Model for Semantic Textual Similarity

Journal of Information Systems and Telecommunication (JIST)

https://doi.org/10.61186/jist.48127.13.49.24