Bu çalışmada, Kahramanmaraş’dan (Türkiye) 2023/2024 hasat sezonunda elde edilen ekstra sızma zeytinyağlarının (n=40) yağ asidi ve trigliserid (TAG) profillerine, çoklu doğrusal bağlantı ve doğrusal bağımlılıktan kaynaklanan matris dengesizliklerini teşhis etmek ve ele almak amacıyla temel bileşen analizi (PCA) uygulanmıştır. Veri boyutunu azaltmak ve örnek varyabilitesini belirlemek için toplam 34 değişken (23 deneysel ve 11 türetilmiş) kullanılmıştır. Standartlaştırılmış değişkenlerle yapılan ilk PCA denemesi zayıf faktörlenebilirlik göstermiş (Kaiser-Meyer-Olkin ölçüsü, KMO=0.13 ve örneklem yeterlilik ölçüsü, MSA<0.40) ve Bartlett küresellik testi, korelasyon matrisi pozitif tanımlı olmadığından hesaplanamamıştır. Çoklu doğrusal bağlantı ve doğrusal bağımlılık, Pearson korelasyonları ve regresyon tabanlı tanı araçları (varyans şişirme faktörü, VIF; tolerans indeksi, TI; koşul indeksi, CI; ve varyans ayrışım oranları, VDP) kullanılarak değerlendirilmiştir. Yüksek korelasyon ve gereksiz bilgi gösteren çoğu türetilmiş değişkenin veri setinden çıkarılarak değişken sayısı 23’e indirilmiş ve tekrar edilen PCA’da, Bartlett küresellik testi anlamlı hale gelmiş (P<0.001), ancak KMO=0.49 değeri modelin henüz yeterli faktörlenebilirliğe sahip olmadığını göstermiştir. MSA (<0.40) ve çoklu doğrusal bağlantı tanı ölçütleri (VIF>10; TI<0.10) temelinde kademeli bir eleme ile 17 değişkenli optimize bir model elde edilmiştir. Nihai model, toplam varyansın %74’ünü açıklayan 5 ana bileşen (PC) üretmiş ve kabul edilebilir bir örnekleme yeterliliği seviyesine ulaşmıştır (KMO=0.70). Promax rotasyonunda, değişkenler çoğunlukla desen matrisinde ilgili PC’lere benzersiz ve güçlü bir şekilde atanırken, yapı matrisinde ikincil yüklemeler sınırlı ölçüde gerçekleşmiştir. Skor analizinde, çoğu örnek PC1-PC2 düzleminde bir ayrım göstermiştir. Ek olarak, yalnızca 10 örnek (%25) standartlaştırılmış z-skor eşiğini aşmıştır (|z|>2). Genel olarak, sonuçlar, zeytinyağı verilerinin güvenilir ve yorumlanabilir PCA modellemesi için faktörlenebilirliğin ve çoklu bağlantı sorunlarının açık bir şekilde yönetilmesi ve korelasyon matrisi yapısı ile skor dağılımlarının dikkatlice incelenmesi gerektiğini göstermiştir.
Zeytinyağı yağ asitleri trigliseridler ECN temel bileşen analizi çoklu doğrusal bağlantı doğrusal bağımlılık
Etik kurul raporu gerekmemektedir.
In this study, principal component analysis (PCA) was applied to fatty acid and triglyceride (TAG) profiles of extra virgin olive oils (n=40) obtained from Kahramanmaraş (Türkiye) during the 2023/2024 harvest season to diagnose and address matrix instabilities caused by multicollinearity and linear dependence. A total of 34 variables (23 experimental and 11 derived) were used to reduce data dimensionality and determine sample variability. The initial PCA attempt with standardized variables showed poor factorability (Kaiser-Meyer-Olkin measure, KMO=0.13; measure of sampling adequacy, MSA<0.40), and Bartlett’s test of sphericity could not be calculated because the correlation matrix was not positive definite. Multicollinearity and linear dependence were assessed using Pearson correlations and regression-based diagnostics (variance inflation factor, V IF; t olerance i ndex, T I; condition index, CI; and variance decomposition proportions, VDP). Most derived variables showing high correlations and redundant information were removed from the dataset, reducing the number of variables to 23, and in the repeated PCA, Bartlett’s test of sphericity became significant (P<0.001), but the KMO value of 0.49 indicated that the model still had insufficient factorability. An optimized 17-variable model was obtained through a stepwise screening based on MSA (<0.40) and multicollinearity criteria (VIF>10; TI<0.10). The final m odel p roduced 5 principal c omponents ( PCs) t hat e xplained 7 4% of t he t otal variance and reached an acceptable level of sampling adequacy (KMO=0.70). After Promax rotation, variables were mostly loaded uniquely and strongly on the relevant PCs in the pattern matrix, while secondary loadings were limited in the structure matrix. In the score analysis, most samples showed separation on the PC1-PC2 plane. Additionally, only 10 samples (25%) exceeded the standardized z-score threshold (|z|>2). Overall, the results indicated that for reliable and interpretable PCA modelling of the olive oil data, it is necessary to clearly manage factorability and multicollinearity issues and to carefully examine the correlation matrix structures and the score distributions.
Olive oil fatty acids triglycerides ECN principal component analysis multicollinearity linear dependence
An ethics committee report is not required
| Primary Language | English |
|---|---|
| Subjects | Food Engineering |
| Journal Section | Research Article |
| Authors | |
| Submission Date | February 17, 2026 |
| Acceptance Date | March 17, 2026 |
| Publication Date | March 31, 2026 |
| DOI | https://doi.org/10.15237/gida.GD26019 |
| IZ | https://izlik.org/JA43AU96CG |
| Published in Issue | Year 2026 Volume: 51 Issue: 2 |
GIDA / The Journal of FOOD is licensed under a Creative Commons Attribution-Non Commercial 4.0 International (CC BY-NC 4.0).