Research Article

Determination of the Semantic Similarity of Turkish Texts Using Probabilistic Methods

Volume: 3 Number: 2 December 28, 2018
EN TR

Determination of the Semantic Similarity of Turkish Texts Using Probabilistic Methods

Abstract

Text mining is the process to deriving useful information from unstructured text data. During this process, text mining uses statistical and mathematical methods. Major text mining tasks include text categorization, text clustering, concept extraction, document summarization, semantic similarity and author identification. In this study, semantic similarity issues have been examined. Semantic similarity analysis aims to determine semantic similarity between texts. Probabilistic latent semantic analysis and latent Dirichlet allocation are probabilistic methods to determine semantic similarity between texts. In this study, semantic analysis using probabilistic latent semantic analysis and latent Dirichlet allocation methods is examined. Also, an application which is conducted to analyze semantic similarity and classify Turkish textual data chosen from different news agencies is discussed. R statistical programming language and Matlab are used in the application.

Keywords

References

  1. Hoffman T, 2015. Unsupervised Learning by Probabilistic Latent Semantic Analysis. Machine Learning, 42: 177-196.
  2. Deerwester S, Dumais ST, Furnas GW, Landauer TK, Harshman R, 1990. Indexing by latent semantic analysis. Journal of the American society for information science, 41(6): 391-407.
  3. Blei DM, Ng AY, Jordan MI, 2003. Latent dirichlet allocation. Journal of Machine Learning Research, 3: 993-1022.
  4. Dempster AP, Laird NM, Rubin, DB, 1977. Maximum likelihood from incomplete data via the EM algorithm. Journal of the royal statistical society: 1-38.
  5. Zemberek NLP, http://zemberek-web.appspot.com/ [erişim 03/2014]
  6. Hornik K, Grün B, 2011. topicmodels: An R package for fitting topic models. Journal of Statistical Software, 40 (13): 1-30.
  7. Porter MF, 1980. An algorithm for suffix stripping. Program, 14 (3): 130-137

Details

Primary Language

Turkish

Subjects

Engineering

Journal Section

Research Article

Authors

Engin Yıldıztepe
DOKUZ EYLÜL ÜNİVERSİTESİ, FEN FAKÜLTESİ, İSTATİSTİK BÖLÜMÜ
Türkiye

Volkan Uzun This is me
Türkiye

Publication Date

December 28, 2018

Submission Date

November 10, 2017

Acceptance Date

December 7, 2018

Published in Issue

Year 2018 Volume: 3 Number: 2

APA
Yıldıztepe, E., & Uzun, V. (2018). Olasılıksal Yöntemler ile Türkçe Metinlerin Anlamsal Benzerliğinin Belirlenmesi. Sinop Üniversitesi Fen Bilimleri Dergisi, 3(2), 66-78. https://doi.org/10.33484/sinopfbd.350445
AMA
1.Yıldıztepe E, Uzun V. Olasılıksal Yöntemler ile Türkçe Metinlerin Anlamsal Benzerliğinin Belirlenmesi. Sinop Uni J Nat Sci. 2018;3(2):66-78. doi:10.33484/sinopfbd.350445
Chicago
Yıldıztepe, Engin, and Volkan Uzun. 2018. “Olasılıksal Yöntemler Ile Türkçe Metinlerin Anlamsal Benzerliğinin Belirlenmesi”. Sinop Üniversitesi Fen Bilimleri Dergisi 3 (2): 66-78. https://doi.org/10.33484/sinopfbd.350445.
EndNote
Yıldıztepe E, Uzun V (December 1, 2018) Olasılıksal Yöntemler ile Türkçe Metinlerin Anlamsal Benzerliğinin Belirlenmesi. Sinop Üniversitesi Fen Bilimleri Dergisi 3 2 66–78.
IEEE
[1]E. Yıldıztepe and V. Uzun, “Olasılıksal Yöntemler ile Türkçe Metinlerin Anlamsal Benzerliğinin Belirlenmesi”, Sinop Uni J Nat Sci, vol. 3, no. 2, pp. 66–78, Dec. 2018, doi: 10.33484/sinopfbd.350445.
ISNAD
Yıldıztepe, Engin - Uzun, Volkan. “Olasılıksal Yöntemler Ile Türkçe Metinlerin Anlamsal Benzerliğinin Belirlenmesi”. Sinop Üniversitesi Fen Bilimleri Dergisi 3/2 (December 1, 2018): 66-78. https://doi.org/10.33484/sinopfbd.350445.
JAMA
1.Yıldıztepe E, Uzun V. Olasılıksal Yöntemler ile Türkçe Metinlerin Anlamsal Benzerliğinin Belirlenmesi. Sinop Uni J Nat Sci. 2018;3:66–78.
MLA
Yıldıztepe, Engin, and Volkan Uzun. “Olasılıksal Yöntemler Ile Türkçe Metinlerin Anlamsal Benzerliğinin Belirlenmesi”. Sinop Üniversitesi Fen Bilimleri Dergisi, vol. 3, no. 2, Dec. 2018, pp. 66-78, doi:10.33484/sinopfbd.350445.
Vancouver
1.Engin Yıldıztepe, Volkan Uzun. Olasılıksal Yöntemler ile Türkçe Metinlerin Anlamsal Benzerliğinin Belirlenmesi. Sinop Uni J Nat Sci. 2018 Dec. 1;3(2):66-78. doi:10.33484/sinopfbd.350445

Cited By


Articles published in Sinopjns are licensed under CC BY-NC 4.088x31.png