Araştırma Makalesi

İnce Ayar ile PyAnnote Kullanılarak Konuşmacı Güncesi Çıkarımı Doğruluğunun Artırılması

Cilt: 8 Sayı: 2 29 Eylül 2025
PDF İndir
TR EN

İnce Ayar ile PyAnnote Kullanılarak Konuşmacı Güncesi Çıkarımı Doğruluğunun Artırılması

Öz

Konuşma işleme, konuşmacı güncesi çıkarımı, konuşma tanıma ve ses olayı tespiti gibi birçok uygulamada önemli bir rol oynamaktadır. Bu çalışma, firma çağrı merkezi kayıtları üzerinde karşılaştırmalı bir analiz sunmak amacıyla PyAnnote adlı güçlü, açık kaynaklı konuşmacı güncesi çıkarım aracını kullanmaktadır. PyAnnote modelleri, firma çağrı merkezi kayıtlarının etiketlenmesiyle elde edilen veri seti ile ince ayar yapılarak değerlendirilmiş ve baz model performansları ile karşılaştırılmıştır. Model performansları, DER metriği kullanılarak değerlendirilmiş ve sonuç olarak, ince ayar yapılan PyAnnote 3.1 modeli üstün performans göstermiştir. İnce ayar sonrası PyAnnote 3.1 versiyonunun DER puanı %21.9’dan %15.6’ya düşmüştür.

Anahtar Kelimeler

Destekleyen Kurum

TÜBİTAK TEYDEB

Proje Numarası

3221247

Teşekkür

Bu çalışma TÜBİTAK TEYDEB 1501 kapsamında desteklenen 3221247 numaralı "Ses Kayıtlarındaki Konuşmacı Sayısının Belirlenmesini ve Konuşmacı Seslerinin Ayrıştırılmasını Sağlayan Derin Yapay Sinir Ağı Mimarisi Tabanlı Sistemin Geliştirilmesi" isimli proje kapsamında gerçekleştirilmiştir. Çalışmamızı desteklediği için TÜBİTAK TEYDEB'e teşekkürlerimizi sunarız.

Kaynakça

  1. Ahmad, R., Zubair, S., 2019. Unsupervised deep feature embeddings for speaker diarization. Turkish Journal of Electrical Engineering and Computer Sciences, 27(4), 3138-3149. DOI:10.3906/elk-1901-125
  2. Anguera, X., Bozonnet, S., Evans, N., Fredouille, C., Friedland, G., Vinyals, O., 2012. Speaker diarization: A review of recent research. IEEE Transactions on Audio, Speech, and Language Processing, 20(2), 356-370. HAL Id: hal-00733397
  3. Bonastre, J.-F., Wils, F., Meignier, S., 2005. ALIZE, a free toolkit for speaker recognition. IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP '05), 1, I/737-I/740. DOI:10.1109/ICASSP.2005.1415219
  4. Bredin, H., 2023. pyannote.audio 2.1 speaker diarization pipeline: Principle, benchmark, and recipe. 24th Interspeech Conference (INTERSPEECH 2023), 1983-1987. HAL Id: hal-04247212
  5. Bredin, H., Laurent, A., 2021. End-to-end speaker segmentation for overlap-aware resegmentation. arXiv:2104.04045
  6. Bredin, H., Yin, R., Coria, J.M., Gelly, G., Korshunov, P., Lavechin, M., Gill, M.P., 2020. Pyannote.audio: Neural building blocks for speaker diarization. ICASSP 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 7124-7128. arXiv:1911.01255v1
  7. Broux, P.-A., Desnous, F., Larcher, A., Petitrenaud, S., Carrive, J., Meignier, S., 2018. S4D: Speaker Diarization Toolkit in Python. Interspeech 2018, 1368-1372. HAL Id: hal-02280162
  8. Carletta, J., Ashby, S., Bourban, S., Flynn, M., Guillemot, M., Hain, T., Wellner, P., 2005. The AMI meeting corpus: A pre-announcement. International Workshop on Machine Learning for Multimodal Interaction, 28-39. DOI:10.1007/11677482_3

Ayrıntılar

Birincil Dil

Türkçe

Konular

Doğal Dil İşleme

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

29 Eylül 2025

Gönderilme Tarihi

8 Ekim 2024

Kabul Tarihi

21 Nisan 2025

Yayımlandığı Sayı

Yıl 2025 Cilt: 8 Sayı: 2

Kaynak Göster

APA
Toprak, A. G., Çepni, S., & Ozan, Ş. (2025). İnce Ayar ile PyAnnote Kullanılarak Konuşmacı Güncesi Çıkarımı Doğruluğunun Artırılması. Journal of Intelligent Systems: Theory and Applications, 8(2), 105-114. https://doi.org/10.38016/jista.1563512
AMA
1.Toprak AG, Çepni S, Ozan Ş. İnce Ayar ile PyAnnote Kullanılarak Konuşmacı Güncesi Çıkarımı Doğruluğunun Artırılması. jista. 2025;8(2):105-114. doi:10.38016/jista.1563512
Chicago
Toprak, Amine Gonca, Sercan Çepni, ve Şükrü Ozan. 2025. “İnce Ayar ile PyAnnote Kullanılarak Konuşmacı Güncesi Çıkarımı Doğruluğunun Artırılması”. Journal of Intelligent Systems: Theory and Applications 8 (2): 105-14. https://doi.org/10.38016/jista.1563512.
EndNote
Toprak AG, Çepni S, Ozan Ş (01 Eylül 2025) İnce Ayar ile PyAnnote Kullanılarak Konuşmacı Güncesi Çıkarımı Doğruluğunun Artırılması. Journal of Intelligent Systems: Theory and Applications 8 2 105–114.
IEEE
[1]A. G. Toprak, S. Çepni, ve Ş. Ozan, “İnce Ayar ile PyAnnote Kullanılarak Konuşmacı Güncesi Çıkarımı Doğruluğunun Artırılması”, jista, c. 8, sy 2, ss. 105–114, Eyl. 2025, doi: 10.38016/jista.1563512.
ISNAD
Toprak, Amine Gonca - Çepni, Sercan - Ozan, Şükrü. “İnce Ayar ile PyAnnote Kullanılarak Konuşmacı Güncesi Çıkarımı Doğruluğunun Artırılması”. Journal of Intelligent Systems: Theory and Applications 8/2 (01 Eylül 2025): 105-114. https://doi.org/10.38016/jista.1563512.
JAMA
1.Toprak AG, Çepni S, Ozan Ş. İnce Ayar ile PyAnnote Kullanılarak Konuşmacı Güncesi Çıkarımı Doğruluğunun Artırılması. jista. 2025;8:105–114.
MLA
Toprak, Amine Gonca, vd. “İnce Ayar ile PyAnnote Kullanılarak Konuşmacı Güncesi Çıkarımı Doğruluğunun Artırılması”. Journal of Intelligent Systems: Theory and Applications, c. 8, sy 2, Eylül 2025, ss. 105-14, doi:10.38016/jista.1563512.
Vancouver
1.Amine Gonca Toprak, Sercan Çepni, Şükrü Ozan. İnce Ayar ile PyAnnote Kullanılarak Konuşmacı Güncesi Çıkarımı Doğruluğunun Artırılması. jista. 01 Eylül 2025;8(2):105-14. doi:10.38016/jista.1563512

Zeki Sistemler Teori ve Uygulamaları Dergisi