Bu çalışmada, çok modlu analitikler için bakış noktaları ile açılarını tahmin etmek amacıyla görünüm ve özellik tabanlı yöntemlere dayalı bir bakış izleme modeli geliştirilmiştir. İlk olarak bir göz veri seti oluşturulmuştur. Veri toplama sürecinde, 25 noktalı bir kalibrasyon tasarımı kullanılarak laboratuvar ortamında 128 katılımcıdan veri elde edilmiştir. TrGaze24 adını verdiğimiz veri setinden tahmin modeli oluşturmak için bir evrişimli sinir ağı (CNN) tasarlanmış ve yüz görüntülerinden çıkarılan sağ ve sol gözlere ait 18.410 göz görüntüsü, göz açıları ve yüz özellikleri modele girdi olarak sunulmuştur. Çıktılar, ekran üzerindeki hedef noktaların x ve y koordinatları ile bakış açısı vektörleri şeklinde belirlenmiştir. Modelin performansı için ortalama mutlak hatalar hesaplanmıştır, bakışa ait noktasal uzaklıkların tahminlerinde 3,74 cm ve açısal vektörlerin tahminlerinde 3,32 derece hata oranıyla literatürdeki benzer çalışmalara kıyasla oldukça başarılı bulunmuştur. Özellikle eğitim teknolojileri açısından, bilgisayar destekli eğitim ortamlarında web kamerası tabanlı bakış izleme sistemlerin temelini oluşturma potansiyeli taşımaktadır. Bu model, öğrenme analitiklerinde bilişsel süreçlerin incelenmesine olanak tanırken, aynı zamanda psikoloji, reklamcılık ve sosyal bilimler gibi alanlarda da kullanılabilirliğiyle dikkat çekmektedir.
This study developed a gaze tracking model based on appearance- and feature-based methods to predict gaze points and angles within the scope of multimodal analytics. First, an eye dataset was created. During the data collection process, data were obtained from 128 participants in a laboratory setting using a 25-point calibration design. To create a prediction model from the dataset, which we named TrGaze24, a convolutional neural network (CNN) was designed. The model utilized 18,410 eye images (right and left eyes) extracted from facial data, along with gaze angles and facial features, as inputs. The outputs were defined as the x and y coordinates of target points on the screen and gaze direction vectors. The model's performance was evaluated by calculating mean absolute errors, with point-based gaze predictions showing an error of 3,74 cm and angular vector predictions an error of 3.32 degrees. These results demonstrated significant success compared to similar studies in the literature. Particularly in educational technologies, the model holds potential to form the foundation of webcam-based gaze tracking systems in computer-assisted learning environments. In addition to enabling the analysis of cognitive processes in learning analytics, the model also stands out for its applicability in fields such as psychology, advertising, and social sciences.
| Primary Language | Turkish |
|---|---|
| Subjects | Deep Learning, Neural Networks, Machine Vision , Machine Learning (Other) |
| Journal Section | Research Article |
| Authors | |
| Submission Date | March 13, 2025 |
| Acceptance Date | July 6, 2025 |
| Publication Date | January 14, 2026 |
| DOI | https://doi.org/10.47495/okufbed.1657375 |
| IZ | https://izlik.org/JA73XS55ST |
| Published in Issue | Year 2026 Volume: 9 Issue: 1 |
*This journal is an international refereed journal
*Our journal does not charge any article processing fees over publication process.
* This journal is online publishes 5 issues per year (January, March, June, September, December)
*This journal published in Turkish and English as open access.
* This work is licensed under a Creative Commons Attribution 4.0 International License.