Araştırma Makalesi

Bulanık K-En Yakın Komşuluk Algoritmasında Lempel-Ziv Mesafe Ölçütünün Etkisi: Büyüme Faktörlerinin Sınıflandırılması Örneği

Cilt: 5 Sayı: 2 21 Aralık 2024
PDF İndir
EN TR

Bulanık K-En Yakın Komşuluk Algoritmasında Lempel-Ziv Mesafe Ölçütünün Etkisi: Büyüme Faktörlerinin Sınıflandırılması Örneği

Öz

Hücresel olaylar, proteinlerin eylemleri sonucunda gerçekleşir. Amino asitlerin farklı dizilimleri farklı protein yapılarının oluşmasına neden olur. Yapılarına göre hücresel olaylardaki aktiviteleri de değişiklik gösterir. Bu nedenle protein dizilerinin yapısal veya işlevsel olarak sınıflandırılması hücresel olaylardaki rolleri hakkında bilgi edinmek için oldukça değerlidir. Büyüme faktörleri; hücreler üzerinde çoğalma, farklılaşma, onarım ve bakım gibi birçok süreçte yer alan proteinlerdir. Büyüme faktörlerinin in vivo çalışmaları kısa yarı ömre, zayıf bir dayanıklılığa yol açar. Biyoenformatik alanı temelinde literatürde NGF ve BDNF’nin sınıflandırılmasıyla ilgili herhangi bir çalışma bulunmamaktadır Büyüme faktörlerinin biyoenformatik alanında incelenmesi düşük maliyetle, daha hızlı sonuçlara ulaşılmasını sağlayabilir. Nörotrofinler; sinir hücrelerinin büyümesi, çoğalması, farklılaşması ve fonksiyonları üzerinde etkili olan büyüme faktörü ailelerinden biridir. Çalışmalar, her ne kadar nörotrofin ailesinin üyeleri olan NGF ve BDNF’ye dair bilgiler sunsa da hücresel ve moleküler işlevlerinin hala iyi anlaşılmadığını da göstermektedir. Biyoenformatik alanında yaygın olarak kullanılan k-En Yakın Komşuluk (KNN) algoritmasının performansı önemli ölçüde kullanılan mesafeye bağlıdır. Bulanık KNN (FKNN) algoritması için de mesafe ölçümleri, bulanıklık derecesini hesaplamak için önemlidir. Çalışmamızda, ortak bir atadan gelen ve çok benzer yüksek dereceli protein yapısına sahip olan NGF ve BDNF’nin, ayrıca NT-3’ün bulanık sınıflandırılması yapılmaktadır. Ayrıca çalışmada, FKNN algoritmasında test verisi ile eğitim verileri arasındaki mesafeyi ölçmek için protein sekanslarının Lempel-Ziv karmaşıklık değerlerine dayalı mesafe ölçümünün kullanılması önerilmektedir. Uniprot veri tabanından alınan verilerle birlikte FKNN algoritmasında Lempel-Ziv uzaklığı kullanıldığında K komşu sayısının 12 olması karşılığında, sınıflandırma performansı %83 olarak elde edilmiştir. Öklid Uzaklığı kullanıldığında elde edilen en yüksek sınıflandırma performansı ise %75’tir. Maksimum doğruluk oranını elde ettiğimiz noktada Öklid uzaklığını kullandığımızda algoritmamızın çalışma süresi 0.0054 ms iken Lempel-Ziv uzaklığı kullandığımızda 0.0038 ms’dir. Literatürde NGF ve BDNF’nin sınıflandırılmasıyla ilgili herhangi bir çalışma bulunmaması sebebiyle, elde edilen bulgular, makine öğrenmesi tekniklerinin nörotrofinlerin sınıflandırılmasında ilk kez uygulanması açısından bir yenilik sunmaktadır.

Anahtar Kelimeler

Bulanık k-en yakın komşu algoritması, büyüme faktörü, Lempel-Ziv karmaşıklığı, nörotrofinler, protein sekansı.

Kaynakça

  1. [1] “Protein structure”, nature.com, 2014. [Online]. Available: https://www.nature.com/scitable/topicpage/protein-structure-14122136/. [Accessed: 6 June 2022].
  2. [2] K. Ahern, I. Rahagopal, T. Tan, “2.3: Structure & fuction- proteins I”, bio.libretext.org, Mar. 7, 2022. [Online]. Available: https://bio.libretexts.org/Bookshelves/Biochemistry/Book%3A_Biochemistry_Free_For_All_(Ahern_Rajagopal_and_Tan)/02%3A_Structure_and_Function/203%3A_Structure__Function-_Proteins_I [Accessed: June. 6, 2022]
  3. [3] J. Maillo, J. Luengo, S. Garcia, F. Herrera, I. Triguero, “Exact fuzzy k-nearest neighbor classification for big datasets”, 2017 IEEE International Conference on Fuzzy Systems (FUZ-IEEE), July 09-12, 2017, Naples, Italy [Online]. Available: IEEE Xplore, https://ieeexplore.ieee.org/document/8015686/authors#authors, [Accessed: 12 June 2022]
  4. [4] James M. Keller, Michael R. Gray, James A. Givens, “A fuzzy k-nearest neighbor algorithm”, IEEE Transactions on Systems, Man, and Cybernetics, vol: SMC-15, issue:4, pp. 580-585, July-Aug 1985, Doi: 10.1109/TSMC.1985.6313426. [Accessed: 15 June 2022]
  5. [5] X. Zheng, C. Li, J. Wang, “An information-theoretic approach to the prediction of protein structural class”, Journal of Computational Chemistry, vol. 31, issue 6, pp. 1201-1206, September 2009, Doi: 10.1002/jcc.21406. [Accessed: 28 June 2022]
  6. [6] JY. Chang, JJ. Shyu, YX. Shi (2008). “Fuzzy k-nearest neighbor classifier to predict protein solvent accessibility” Ishikawa, M., Doya, K. Miyamoto, H., Yamakawa, T., Neural Information Processing. ICONIP 2007, vol 4985, pp. 837-845, Springer, Berlin, Heidelberg. [Online]. Doi: https://doi.org/10.1007/978-3-540-69162-4_87. [Accessed: 28 June 2022]
  7. [7] Y. Huang, Y. Li, “Prediction of protein subcellular locations using fuzzy k-NN method”, Bioinformatics, vol. 20, no. 1, pages. 21-8, 2004 Jan. [Online]. Doi: 10.1093/bioinformatics/btg366. [Accessed: 25 June 2022]
  8. [8] R. Bondugula, O. Duzlevski, D. XU, “Profiles and fuzzy k-nearest neighbor algorithm for protein secondary structure prediction”, Proceedings of the 3rd Asia-Pacific Bioinformatics Conference, pp. 85-94, January 2005, Singapore, [Online]. Doi: 10.1142/9781860947322_0009. [Accessed: 1 July 2022]
  9. [9] M. Kumar, SK. Rath, “Microarray data classification using fuzzy k-nearest neighbor”, International Conference on Contemporary Computing and Informatics (IC3I), Mysore, India, IEEE, pp. 1032-1038, November 2014, Doi: 10.1109/IC3I.2014.7019618 [Accessed: 1 July 2022]
  10. [10] D. Li, JS, Deogun, K. Wang, “Gene function classification using fuzzy k-nearest neighbor approach”, 2007 IEEE International Conference on Granular Computing (GRC 2007), Fremont, CA, USA, IEEE Xplore, pp. 644-644, November 2007, Doi: 10.1109/GrC.2007.99. [Accessed: 28 June 2022]

Kaynak Göster

APA
Çifci, B. T., Kabadayı, R., & Kandemir Çavaş, Ç. (2024). Bulanık K-En Yakın Komşuluk Algoritmasında Lempel-Ziv Mesafe Ölçütünün Etkisi: Büyüme Faktörlerinin Sınıflandırılması Örneği. Journal of Science, Technology and Engineering Research, 5(2), 148-162. https://doi.org/10.53525/jster.1573661
AMA
1.Çifci BT, Kabadayı R, Kandemir Çavaş Ç. Bulanık K-En Yakın Komşuluk Algoritmasında Lempel-Ziv Mesafe Ölçütünün Etkisi: Büyüme Faktörlerinin Sınıflandırılması Örneği. Journal of Science, Technology and Engineering Research. 2024;5(2):148-162. doi:10.53525/jster.1573661
Chicago
Çifci, Berk Tolga, Ramazan Kabadayı, ve Çağın Kandemir Çavaş. 2024. “Bulanık K-En Yakın Komşuluk Algoritmasında Lempel-Ziv Mesafe Ölçütünün Etkisi: Büyüme Faktörlerinin Sınıflandırılması Örneği”. Journal of Science, Technology and Engineering Research 5 (2): 148-62. https://doi.org/10.53525/jster.1573661.
EndNote
Çifci BT, Kabadayı R, Kandemir Çavaş Ç (01 Aralık 2024) Bulanık K-En Yakın Komşuluk Algoritmasında Lempel-Ziv Mesafe Ölçütünün Etkisi: Büyüme Faktörlerinin Sınıflandırılması Örneği. Journal of Science, Technology and Engineering Research 5 2 148–162.
IEEE
[1]B. T. Çifci, R. Kabadayı, ve Ç. Kandemir Çavaş, “Bulanık K-En Yakın Komşuluk Algoritmasında Lempel-Ziv Mesafe Ölçütünün Etkisi: Büyüme Faktörlerinin Sınıflandırılması Örneği”, Journal of Science, Technology and Engineering Research, c. 5, sy 2, ss. 148–162, Ara. 2024, doi: 10.53525/jster.1573661.
ISNAD
Çifci, Berk Tolga - Kabadayı, Ramazan - Kandemir Çavaş, Çağın. “Bulanık K-En Yakın Komşuluk Algoritmasında Lempel-Ziv Mesafe Ölçütünün Etkisi: Büyüme Faktörlerinin Sınıflandırılması Örneği”. Journal of Science, Technology and Engineering Research 5/2 (01 Aralık 2024): 148-162. https://doi.org/10.53525/jster.1573661.
JAMA
1.Çifci BT, Kabadayı R, Kandemir Çavaş Ç. Bulanık K-En Yakın Komşuluk Algoritmasında Lempel-Ziv Mesafe Ölçütünün Etkisi: Büyüme Faktörlerinin Sınıflandırılması Örneği. Journal of Science, Technology and Engineering Research. 2024;5:148–162.
MLA
Çifci, Berk Tolga, vd. “Bulanık K-En Yakın Komşuluk Algoritmasında Lempel-Ziv Mesafe Ölçütünün Etkisi: Büyüme Faktörlerinin Sınıflandırılması Örneği”. Journal of Science, Technology and Engineering Research, c. 5, sy 2, Aralık 2024, ss. 148-62, doi:10.53525/jster.1573661.
Vancouver
1.Berk Tolga Çifci, Ramazan Kabadayı, Çağın Kandemir Çavaş. Bulanık K-En Yakın Komşuluk Algoritmasında Lempel-Ziv Mesafe Ölçütünün Etkisi: Büyüme Faktörlerinin Sınıflandırılması Örneği. Journal of Science, Technology and Engineering Research. 01 Aralık 2024;5(2):148-62. doi:10.53525/jster.1573661