Türkçe Metinlerde Sözlük Tabanli Yaklaşimla Duygu Analizi Ve Görselleştirme
Öz
Metin madenciliği yöntemleri, yapılandırılmamış
metinlerden otomatik olarak faydalı bilgilerin çıkarılmasını kolaylaştırmak
için önem kazanmaktadır. Bu amaçla kullanılan metin madenciliği yöntemleri ile
büyük miktardaki metin verileri, kısa zamanda ve yüksek performans ile analiz
edilebilmektedir. Bu çalışmanın temel amacı, kelime sıklığı, bilgi çıkarma,
sınıflandırma, veri işleme ve çıkarma gibi araçlarla Türkçe metinlerinin
işlenmesi ve görselleştirilmesidir. Metin madenciliği alanlarından biri olan
duygu analizi veya fikir madenciliği, görüşler, tutumlar ve duygular gibi öznel
bilgilerin algılanmasını otomatikleştirmek için kullanılmaktadır. Bu tezde
sunulan çalışmada, sosyal medya paylaşımları, roman, müşteri yorumları gibi
Türkçe metinlerin analizine ihtiyaç duyulduğu durumlarda kullanılabilecek yeni
bir araç önerilmektedir. Geliştirilen uygulama esas olarak duygu analizi
yaparken "kelime düzeyinde" çalışmaktadır. Buna ek olarak, duygu
analizinde kullanılan sözlük sıfatlar, isimler, fiiller, zarflar, ön ekler, son
ekler türünde kelimeler içermektedir. Kullanılan birinci sözlük 5.000 kelime,
ikinci ve üçüncü sözlük yaklaşık 25.000 kelime içermektedir. Geliştirilen iki
yöntemle üç farklı veri seti üzerinde deneyler yapılmıştır. Birinci yöntem bu
veri setlerinde sırasıyla %77,14, %72,78 ve %74,17 doğruluk oranına ulaşmıştır.
İkinci yöntem ise aynı veri setleri üzerinde sırasıyla %82,85, %74,92 ve %77,50
doğruluk oranına erişmiştir. Yapılan deneysel çalışmaların sonuçları
incelendiğinde sistemin hatalı karar
verdiği cümleler incelendiğinde hatalı yazılan kelimeler, kinayeli yorumlar,
art niyetli yazılmış yorumlar, bazı deyimlerin ve kelimelerin birden fazla
anlamının olması, karşılaştırma içeren cümlelerin bir taraf için olumlu duygu
taşırken diğer taraf için olumsuz duygu taşıması gibi durumların hatalı tespit
işleminde etkin olduğu gözlemlenmiştir.Bu çalışmanın temel amacı, kelime sıklığı, bilgi çıkarma, sınıflandırma,
makine öğrenmesi, veri işleme ve çıkarma gibi araçlarla Türkçe metinlerinin
işlenmesi ve görselleştirilmesidir.
Anahtar Kelimeler
References
- [1] Simon Kemp, report author , Digital around the world in 2019, the essential line data you need to understand global mobile, internet, and social media use P7. https://wearesocial.com/global-digital-report-2019 .
- [2] Dr. Cebrail Taşkın, MBA Chief Technology Officer (CTO) & Chief Digital Officer, YENİ DEĞER: BÜYÜK VERİ, 2017 https://www.linkedin.com/pulse/yeni-de%C4%9Fer-b%C3%BCy%C3%BCk-veri-dr-cebrail-ta%C5%9Fk%C4%B1n-mba?articleId=6328625124677341184#comments-6328625124677341184&trk=public_profile_post
- [3] Simon Kemp, report author, Digital around the world in 2019, the essential line data you need to understand global mobile, internet, and social media use, we are social 2019 report for Turkey https://wearesocial.com/global-digital-report-2019
- [4] www.marketingturkiye.com.tr, haberler, 2017 rakamlar, Türkiye’de e-ticaret istatistikleri https://www.marketingturkiye.com.tr/haberler/rakamlarla-2017-turkiye-e-ticaret-istatistikleri/.
- [5] Akcayol, M & Özyurt, Barış. (2018). FİKİR MADENCİLİĞİ VE DUYGU ANALİZİ, YAKLAŞIMLAR, YÖNTEMLER ÜZERİNE BİR ARAŞTIRMA. Selcuk University Journal of Engineering ,Science and Technology. 6. 668-693. 10.15317/Scitech.2018.160.
- [6] Abbé, Adeline. Analyse de données textuelles d'un forum médical pour évaluer le ressenti exprimé par les internautes au sujet des antidépresseurs et des anxyolitiques. Diss. Paris Saclay, 2016.
- [7] Stubbs M. Text and corpus analysis: Computer-assisted studies of language and culture. Blackwell Oxford; 1996.
- [8] Roche E, Schabes Y. Finite-state Language Processing. 1997. (MIT Press).
Details
Primary Language
Turkish
Subjects
-
Journal Section
Research Article
Authors
Önder Demir
*
0000-0003-4540-663X
Türkiye
Abdoulaye İssa Baban Chawai
This is me
0000-0001-7042-0252
Türkiye
Buket Doğan
0000-0003-1062-2439
Türkiye
Publication Date
December 31, 2019
Submission Date
August 6, 2019
Acceptance Date
December 27, 2019
Published in Issue
Year 2019 Volume: 1 Number: 2