TR
EN
İnce Ayar ile PyAnnote Kullanılarak Konuşmacı Güncesi Çıkarımı Doğruluğunun Artırılması
Öz
Konuşma işleme, konuşmacı güncesi çıkarımı, konuşma tanıma ve ses olayı tespiti gibi birçok uygulamada önemli bir rol oynamaktadır. Bu çalışma, firma çağrı merkezi kayıtları üzerinde karşılaştırmalı bir analiz sunmak amacıyla PyAnnote adlı güçlü, açık kaynaklı konuşmacı güncesi çıkarım aracını kullanmaktadır. PyAnnote modelleri, firma çağrı merkezi kayıtlarının etiketlenmesiyle elde edilen veri seti ile ince ayar yapılarak değerlendirilmiş ve baz model performansları ile karşılaştırılmıştır. Model performansları, DER metriği kullanılarak değerlendirilmiş ve sonuç olarak, ince ayar yapılan PyAnnote 3.1 modeli üstün performans göstermiştir. İnce ayar sonrası PyAnnote 3.1 versiyonunun DER puanı %21.9’dan %15.6’ya düşmüştür.
Anahtar Kelimeler
Destekleyen Kurum
TÜBİTAK TEYDEB
Proje Numarası
3221247
Teşekkür
Bu çalışma TÜBİTAK TEYDEB 1501 kapsamında desteklenen 3221247 numaralı "Ses Kayıtlarındaki Konuşmacı Sayısının Belirlenmesini ve Konuşmacı Seslerinin Ayrıştırılmasını Sağlayan Derin Yapay Sinir Ağı Mimarisi Tabanlı Sistemin Geliştirilmesi" isimli proje kapsamında gerçekleştirilmiştir. Çalışmamızı desteklediği için TÜBİTAK TEYDEB'e teşekkürlerimizi sunarız.
Kaynakça
- Ahmad, R., Zubair, S., 2019. Unsupervised deep feature embeddings for speaker diarization. Turkish Journal of Electrical Engineering and Computer Sciences, 27(4), 3138-3149. DOI:10.3906/elk-1901-125
- Anguera, X., Bozonnet, S., Evans, N., Fredouille, C., Friedland, G., Vinyals, O., 2012. Speaker diarization: A review of recent research. IEEE Transactions on Audio, Speech, and Language Processing, 20(2), 356-370. HAL Id: hal-00733397
- Bonastre, J.-F., Wils, F., Meignier, S., 2005. ALIZE, a free toolkit for speaker recognition. IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP '05), 1, I/737-I/740. DOI:10.1109/ICASSP.2005.1415219
- Bredin, H., 2023. pyannote.audio 2.1 speaker diarization pipeline: Principle, benchmark, and recipe. 24th Interspeech Conference (INTERSPEECH 2023), 1983-1987. HAL Id: hal-04247212
- Bredin, H., Laurent, A., 2021. End-to-end speaker segmentation for overlap-aware resegmentation. arXiv:2104.04045
- Bredin, H., Yin, R., Coria, J.M., Gelly, G., Korshunov, P., Lavechin, M., Gill, M.P., 2020. Pyannote.audio: Neural building blocks for speaker diarization. ICASSP 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 7124-7128. arXiv:1911.01255v1
- Broux, P.-A., Desnous, F., Larcher, A., Petitrenaud, S., Carrive, J., Meignier, S., 2018. S4D: Speaker Diarization Toolkit in Python. Interspeech 2018, 1368-1372. HAL Id: hal-02280162
- Carletta, J., Ashby, S., Bourban, S., Flynn, M., Guillemot, M., Hain, T., Wellner, P., 2005. The AMI meeting corpus: A pre-announcement. International Workshop on Machine Learning for Multimodal Interaction, 28-39. DOI:10.1007/11677482_3
Ayrıntılar
Birincil Dil
Türkçe
Konular
Doğal Dil İşleme
Bölüm
Araştırma Makalesi
Yayımlanma Tarihi
29 Eylül 2025
Gönderilme Tarihi
8 Ekim 2024
Kabul Tarihi
21 Nisan 2025
Yayımlandığı Sayı
Yıl 2025 Cilt: 8 Sayı: 2
APA
Toprak, A. G., Çepni, S., & Ozan, Ş. (2025). İnce Ayar ile PyAnnote Kullanılarak Konuşmacı Güncesi Çıkarımı Doğruluğunun Artırılması. Journal of Intelligent Systems: Theory and Applications, 8(2), 105-114. https://doi.org/10.38016/jista.1563512
AMA
1.Toprak AG, Çepni S, Ozan Ş. İnce Ayar ile PyAnnote Kullanılarak Konuşmacı Güncesi Çıkarımı Doğruluğunun Artırılması. jista. 2025;8(2):105-114. doi:10.38016/jista.1563512
Chicago
Toprak, Amine Gonca, Sercan Çepni, ve Şükrü Ozan. 2025. “İnce Ayar ile PyAnnote Kullanılarak Konuşmacı Güncesi Çıkarımı Doğruluğunun Artırılması”. Journal of Intelligent Systems: Theory and Applications 8 (2): 105-14. https://doi.org/10.38016/jista.1563512.
EndNote
Toprak AG, Çepni S, Ozan Ş (01 Eylül 2025) İnce Ayar ile PyAnnote Kullanılarak Konuşmacı Güncesi Çıkarımı Doğruluğunun Artırılması. Journal of Intelligent Systems: Theory and Applications 8 2 105–114.
IEEE
[1]A. G. Toprak, S. Çepni, ve Ş. Ozan, “İnce Ayar ile PyAnnote Kullanılarak Konuşmacı Güncesi Çıkarımı Doğruluğunun Artırılması”, jista, c. 8, sy 2, ss. 105–114, Eyl. 2025, doi: 10.38016/jista.1563512.
ISNAD
Toprak, Amine Gonca - Çepni, Sercan - Ozan, Şükrü. “İnce Ayar ile PyAnnote Kullanılarak Konuşmacı Güncesi Çıkarımı Doğruluğunun Artırılması”. Journal of Intelligent Systems: Theory and Applications 8/2 (01 Eylül 2025): 105-114. https://doi.org/10.38016/jista.1563512.
JAMA
1.Toprak AG, Çepni S, Ozan Ş. İnce Ayar ile PyAnnote Kullanılarak Konuşmacı Güncesi Çıkarımı Doğruluğunun Artırılması. jista. 2025;8:105–114.
MLA
Toprak, Amine Gonca, vd. “İnce Ayar ile PyAnnote Kullanılarak Konuşmacı Güncesi Çıkarımı Doğruluğunun Artırılması”. Journal of Intelligent Systems: Theory and Applications, c. 8, sy 2, Eylül 2025, ss. 105-14, doi:10.38016/jista.1563512.
Vancouver
1.Amine Gonca Toprak, Sercan Çepni, Şükrü Ozan. İnce Ayar ile PyAnnote Kullanılarak Konuşmacı Güncesi Çıkarımı Doğruluğunun Artırılması. jista. 01 Eylül 2025;8(2):105-14. doi:10.38016/jista.1563512