Puanlayıcılar Arası Güvenirlik Belirleme Tekniklerinin Karşılaştırılması
Abstract
Bu araştırmada dereceli puanlama anahtarı türü ve puanlayıcı sayısı değişiminin, puanlayıcı güvenirliğini belirlemede kullanılan tekniklerden elde edilen sonuçlar üzerindeki etkisi incelenmiştir. Araştırmanın çalışma grubu, 50 öğrenci ve puanlama yapan 10 öğretmenden oluşmaktadır. Betimsel nitelik taşıyan araştırmada puanlayıcı güvenirliğini belirlemede Kappa istatistik tekniği, log linear analiz tekniği ve Krippendorff alfa tekniği kullanılmıştır. Puanlayıcı sayısı değişiminin puanlayıcı güvenirliğine etkisini incelemek adına belirtilen üç teknik kullanılarak iki, beş ve on puanlayıcı arasındaki uyum düzeyleri hesaplanmıştır. Araştırmada üç teknikten elde edilen analiz sonuçlarında, analitik puanlama anahtarı kullanımıyla elde edilen puanlarda, puanlayıcı sayısı artışının güvenirlik düzeyini düşürdüğü tespit edilmiştir. Üç teknikle yapılan analizlerde, en yüksek güvenirlik değerleri iki puanlayıcı kullanıldığında elde edilmiş, puanlayıcı sayısı artırıldıkça güvenirliğin düştüğü saptanmıştır. Analitik puanlama anahtarını oluşturan kategoriler incelendiğinde kategoriler arasında objektiflik düzeyine dayalı olarak, puanlayıcıların uyum düzeylerinde değişkenlik olduğu saptanmıştır. Araştırmanın sonucunda, kullanılan tekniklerden Kappa tekniği ve Krippendorff alfa tekniğinin paralel sonuçlar verdiği görülmüştür. Bununla birlikte Krippendorff alfa tekniğinin puanlayıcı sayısı değişiminden Kappa tekniğine göre daha az etkilendiği belirlenmiştir. Log-linear analiz tekniğinin ise değişkenler arasındaki etkileşimleri ve uyumsuzluk kaynağını gösteren daha kapsamlı ve geniş bilgi sağladığı tespit edilmiştir. Sonuç olarak, daha detaylı ölçme sonuçları elde edilmek istendiğinde alt kategorilerden oluşan analitik puanlama anahtarı kullanılarak toplanan puanların, kategorik veri analizi için uygun olan log-linear analiz tekniğinin; daha genel ölçme sonuçlarına ulaşılmak istendiğinde ise bütünsel puanlama anahtarı ile elde edilen puanların Krippendorff alfa tekniğinin kullanılmasının uygun olduğu düşünülmektedir.
Keywords
References
- Airasian, P. W. (1994). Classroom assessment. New York: McGraw-Hill.
- Agresti, A. (1996). An introduction to categorical data analysis. New York: John Wiley & Sons, INC.
- Akgül, A. (2005). Tıbbi araştırmalarda istatistiksel analiz teknikleri, SPSS uygulamaları. (3. Baskı). Ankara: Emek Ofset.
- Anthony, J., Viere, M. D., ve Garrett, P.D. (2005). Understanding interobserver agreement: The kappa statistic. Family Medicine, 37(5), 360-362.
- Atılgan, H., Kan, A. ve Doğan, N. (2007). Eğitimde ölçme ve değerlendirme. (2. Basım). Ankara: Anı Yayıncılık.
- Baykul, Y. (2000). Eğitim ve Psikolojide Ölçme: Klasik Test Teorisi ve Uygulaması. Ankara: ÖSYM.
- Brennen, R. L. ve Prediger, D. J. (1981). Coefficient kappa: Some Uses, misuses, and alternatives. Educational and Psychological Measurement, 41(1981), 687-699.
- Burry-Stock, J. A., Shaw, D. G., Laurie, C., ve Chissom, B. S. (1996). Rater agreement indexies for performance assessment. Educational and Psychological Measurement, 56(2), 251-262.
Details
Primary Language
English
Subjects
-
Journal Section
Research Article
Publication Date
April 3, 2017
Submission Date
February 23, 2017
Acceptance Date
March 8, 2017
Published in Issue
Year 2017 Volume: 8 Number: 1
Cited By
Comparative Statistical Analysis of Two Different Methods for Risk Assessment in Chemical Research Laboratory
Uluslararası Muhendislik Arastirma ve Gelistirme Dergisi
https://doi.org/10.29137/umagd.606402Yazılı Anlatım Becerilerinin Değerlendirilmesi İçin Dereceli Puanlama Anahtarı Geliştirme Çalışması
Pamukkale University Journal of Education
https://doi.org/10.9779/pauefd.588565USE OF TAKE-HOME EXAMS FOR REMOTE ASSESSMENT: A CASE STUDY
Journal of Educational Technology and Online Learning
https://doi.org/10.31681/jetol.912965Kadın doğum kliniğinde çalışan hemşire ve ebelerin doğum sonu dönemde hastalara bakım verirken yaşadığı zorluklara ilişkin görüşleri: Kalitatif çalışma
Ordu Üniversitesi Hemşirelik Çalışmaları Dergisi
https://doi.org/10.38108/ouhcd.737857Development of Rubric for the Evaluation of Concept Cartoons in Mathematics
Anadolu Journal Of Educational Sciences International
https://doi.org/10.18039/ajesi.725475Development of Analytical Rubric for Evaluating the Effect of Mobile Design Applications on Artistic Creativity: Validity-Reliability Study
İnönü Üniversitesi Eğitim Bilimleri Enstitüsü Dergisi
https://doi.org/10.29129/inujgse.897929Başarılı Kaynaştırma Uygulamalarına Yönelik Farklı Eğitim Kademelerindeki Öğretmenlerin Görüşlerinin Belirlenmesi
Muğla Sıtkı Koçman Üniversitesi Eğitim Fakültesi Dergisi
https://doi.org/10.21666/muefd.899469Türkiye’deki Covid-19 Reklamları: Bilgilendirici ve Dönüşümsel Mesaj Stratejilerinin Kullanımı
Türkiye İletişim Araştırmaları Dergisi/26306220
https://doi.org/10.17829/turcom.934232Understanding the Processual and Contextual Aspects of Science by Means of the History of Photosynthesis
European Journal of Educational Research
https://doi.org/10.12973/eu-jer.8.2.633BANKA TELEPAZARLAMA BAŞARISININ TAHMİNİ İÇİN BİR BİRLEŞİK MAKİNE ÖĞRENME TABANLI KARAR DESTEK MODELİ
Verimlilik Dergisi
https://doi.org/10.51551/verimlilik.748616Meta-Analizi Anlamak ve Yorumlamak: Hemşireler İçin Pratik Bir Rehber
Dokuz Eylül Üniversitesi Hemşirelik Fakültesi Elektronik Dergisi
https://doi.org/10.46483/deuhfed.872337The effectiveness of auscultatory, colorimetric capnometry and pH measurement methods to confirm placement of nasogastric tubes: A methodological study
International Journal of Nursing Practice
https://doi.org/10.1111/ijn.13049Karikatürle Yazma Çalışmalarının Ortaokul Öğrencilerinin Yaratıcı Yazma Başarısına Etkisi
Ana Dili Eğitimi Dergisi
https://doi.org/10.16916/aded.1023541Uluslararası Ticaret ve Lojistik İle Uluslararası Ticaret ve Lojistik Yönetimi Ana Bilim Dallarında Yazılan Tezlerin İncelenmesi
Selçuk Üniversitesi Sosyal Bilimler Meslek Yüksekokulu Dergisi
https://doi.org/10.29249/selcuksbmyd.1084597Comparison of Inter-Rater Reliability Techniques in Performance-Based Assessment
International Journal of Assessment Tools in Education
https://doi.org/10.21449/ijate.993805Assessment of Mathematical Reasoning Competence in Accordance with PISA 2021 Mathematics Framework
Kuramsal Eğitimbilim
https://doi.org/10.30831/akukeg.1027601Compatibility of High School Entrance Exam Turkish Questions with PISA Reading Skills Proficiency Levels
Ana Dili Eğitimi Dergisi
https://doi.org/10.16916/aded.1151295Evaluation of the effectiveness of the Australian Mental Health Triage Scale in the emergency department: The case of Turkey
Perspectives in Psychiatric Care
https://doi.org/10.1111/ppc.13110Kanguru Bakımı Sırasında Müzik Uygulamasının Prematüre Bebeklerin Davranış Durumu ve Fizyolojik Parametrelerine Etkisi: Bir Sistematik Derleme ve Meta-Analiz Protokolü
Gümüşhane Üniversitesi Sağlık Bilimleri Dergisi
https://doi.org/10.37989/gumussagbil.1138319Using Rasch analysis to examine raters’ expertise Turkish teacher candidates’ competency levels in writing different types of test items
International Journal of Assessment Tools in Education
https://doi.org/10.21449/ijate.1058300EXAMINING THE TYPE AND QUALITY OF QUESTIONS ASKED BY A SCIENCE TEACHER
Journal of Baltic Science Education
https://doi.org/10.33225/jbse/23.22.83PUANLAYICILAR ARASI UYUMUN FARKLI ÖLÇEKLEME TÜRLERİ, PUANLAYICI SAYISI VE PUANLANAN SAYISI AÇISINDAN İNCELENMESİ
Dokuz Eylül Üniversitesi Sosyal Bilimler Enstitüsü Dergisi
https://doi.org/10.16953/deusosbil.1181867Kademelendirilmiş Etkinlik Yoluyla Metin Tabanlı Programlama Öğretimi: İşbirlikli Bir Eylem Araştırması
Asya Öğretim Dergisi
https://doi.org/10.47215/aji.791967Türkiye’de İmar Affı/İmar Barışı Kanunlarının Uygulamaları ve Karşılaşılan Sorunlar: Alanya Örneği
Türkiye Arazi Yönetimi Dergisi
https://doi.org/10.51765/tayod.950031Gıda okuryazarlığı: Bileşenlerin tespiti ve tanımlanması
International Journal of Social Sciences and Education Research
https://doi.org/10.24289/ijsser.836121Türkçe Almanca İki Dilli ve Türkçe Tek Dilli Türkçe Öğretmeni Adaylarının Yazılı Metinlerinde Üstsöylem Belirleyicileri
Ana Dili Eğitimi Dergisi
https://doi.org/10.16916/aded.910889TURKISH VERSION OF THE ZOOM EXHAUSTION AND FATIGUE SCALE: VALIDITY AND RELIABILITY STUDY
Izmir Democracy University Health Sciences Journal
https://doi.org/10.52538/iduhes.1191693Sanal Gerçeklik Gözlüğü Reklamlarına Yönelik Bir İçerik ve Duygu Analizi Çalışması: Quest 2 Örneği
TRT Akademi
https://doi.org/10.37679/trta.1207899REBA yönteminin sınıf içi ve sınıflar arası güvenilirliği: Bir otomotiv yan sanayi firması uygulaması
Gazi Üniversitesi Mühendislik-Mimarlık Fakültesi Dergisi
https://doi.org/10.17341/gazimmfd.1083525Adaptation and Validation of the Responsive Environmental Assessment for Classroom Teaching (REACT): The Dimensionality of Student Perceptions of the Instructional Environment to Turkish for EFL Classrooms
The Literacy Trek
https://doi.org/10.47216/literacytrek.1195388Detection of Papilledema Severity from Color Fundus Images using Transfer Learning Approaches
Aksaray University Journal of Science and Engineering
https://doi.org/10.29002/asujse.1280766Hemşirelik Öğrencilerinin Acının Dönüştürücü Gücü Kavramına İlişkin Algılarının Metafor Analizi Yöntemiyle Belirlenmesi
Ordu Üniversitesi Hemşirelik Çalışmaları Dergisi
https://doi.org/10.38108/ouhcd.1169739Konaklama İşletmelerinde İnsan Kaynakları Çalışanlarına Göre Sapkın Çalışan Davranışları ve Psikolojik İyi Oluş
Fiscaoeconomia
https://doi.org/10.25295/fsecon.1336885Işığın Madde ile Etkileşimi Ünitesine Yönelik Kavramsal Anlama Testi Geliştirme Çalışması
Dokuz Eylül Üniversitesi Buca Eğitim Fakültesi Dergisi
https://doi.org/10.53444/deubefd.1278350Examining YOUTUBE Videos with Counting and Numbers Content for Preschool Children
Osmangazi Journal of Educational Research
https://doi.org/10.59409/ojer.1363341Yabancı dil olarak Türkçe öğretiminde konuşma becerisine yönelik biçimlendirici değerlendirme temelli dereceli puanlama anahtarı geliştirme çalışması
RumeliDE Dil ve Edebiyat Araştırmaları Dergisi
https://doi.org/10.29000/rumelide.1372349ÖZEL GEREKSİNİMLİ BİREYLERİN BAŞARI ÖYKÜLERİNE YÖNELİK ULUSLARARASI HABER AJANSLARINDA YER ALAN HABERLERİN ANALİZİ
Gümüşhane Üniversitesi İletişim Fakültesi Elektronik Dergisi
https://doi.org/10.19145/e-gifder.1283720Investigation of ChatGPT and Real Raters in Scoring Open-Ended Items in Terms of Inter-Rater Reliability
Uluslararası Türk Eğitim Bilimleri Dergisi
https://doi.org/10.46778/goputeb.1345752Özel Gereksinimli Çocuğa Karşı Prososyal Davranış Ölçeği Geçerlik ve Güvenirlik Çalışması
Manisa Celal Bayar Üniversitesi Eğitim Fakültesi Dergisi
https://doi.org/10.52826/mcbuefd.13400192022 LGS TÜRKÇE SORULARININ PISA OKUMA BECERİLERİ YETERLİLİK DÜZEYLERİ AÇISINDAN İNCELENMESİ
International Journal Of Turkish Literature Culture Education
https://doi.org/10.7884/teke.1286561An Illustration of a Latent Class Analysis for Interrater Agreement: Identifying Subpopulations with Different Agreement Levels
Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi
https://doi.org/10.21031/epod.1308732A Cronbach’s Alpha Generalization Meta-Analysis Study of the Problematic Pornography Consumption Scale
Sexual Health & Compulsivity
https://doi.org/10.1080/26929953.2024.2317743Açıklayıcı Metin Yapısı Farkındalığı Testinin Geliştirilmesi
Batı Anadolu Eğitim Bilimleri Dergisi
https://doi.org/10.51460/baebd.1478592Can Natural Language Processing (NLP) Provide Consultancy to Patients About Edentulism Teeth Treatment?
Cureus
https://doi.org/10.7759/cureus.70945Dereceli Puanlama Anahtarı Türünün Rutin Olmayan Matematik Problemlerinin Puanlanmasında Puanlayıcı Davranışları Üzerine Etkisi
Uludağ Üniversitesi Eğitim Fakültesi Dergisi
https://doi.org/10.19171/uefad.1486010Doğu Anadolu Bölgesi Yükseköğretim Kurumlarının Sosyal Medya Pazarlaması Bağlamında Değerlendirilmesi
Anemon Muş Alparslan Üniversitesi Sosyal Bilimler Dergisi
https://doi.org/10.18506/anemon.1422731Uluslararası Öğrencilerin Türkçe Akademik Yazma Becerilerinin Değerlendirilmesine Yönelik Analitik Dereceli Puanlama Anahtarının Geliştirilmesi
Erzincan Üniversitesi Eğitim Fakültesi Dergisi
https://doi.org/10.17556/erziefd.1528118YABANCILARA TÜRKÇE ÖĞRETİMİ DERS KİTAPLARINDA “BEN” VE “BİZ”: BİR ÜSTSÖYLEM ÇÖZÜMLEMESİNDE KÜLTÜREL YANSIMALAR
Türkbilig
https://doi.org/10.59257/turkbilig.1451198Examination Of The Functionality Of The ‘Guitar Education And Accompaniment’ Course Delivered In A Virtual Classroom Environment For Instrument Performance
Salud, Ciencia y Tecnología - Serie de Conferencias
https://doi.org/10.56294/sctconf20251324Validity and Reliability Study of 4-5-Year-Old Empathy Skills Scale
Cukurova University Faculty of Education Journal
https://doi.org/10.14812/cuefd.1462773Açık Uçlu Maddelerin Puanlanmasında Dereceli Puanlama Anahtarı Türünün Puanlayıcı Davranışlarına Etkisi
Türk Eğitim Bilimleri Dergisi
https://doi.org/10.37217/tebd.1501178Üniversite Öğrencilerinin Yazılı Üretimlerinin OpenAI GPT ile Değerlendirilmesi
Yuksekogretim Dergisi
https://doi.org/10.53478/yuksekogretim.1418870A case study on the perception of artificial intelligence by gifted students in Turkey
Journal of Digital Educational Technology
https://doi.org/10.30935/jdet/15809Lexical Approach In Teaching Turkish As A Foreign Language: The Implementation of The Verb "Al-"
Cukurova University Faculty of Education Journal
https://doi.org/10.14812/cuefd.1516352Özel eğitim öğretmenliğine alan değişikliği yaparak geçen öğretmenlerin bireyselleştirilmiş eğitim programı hazırlama ve uygulamaya yönelik görüşlerinin belirlenmesi
ODÜ Sosyal Bilimler Araştırmaları Dergisi (ODÜSOBİAD)
https://doi.org/10.48146/odusobiad.1409001Artificial intelligence-based chatbot assistance in clinical decision-making for medically complex patients in oral surgery: a comparative study
BMC Oral Health
https://doi.org/10.1186/s12903-025-05732-wOkul Öncesi Öğrenme Bağlılığı Gözlem Aracının Geliştirilmesi: Geçerlik ve Güvenirlik Çalışması
Erzincan Üniversitesi Eğitim Fakültesi Dergisi
https://doi.org/10.17556/erziefd.1598138Detection of Flatfoot Deformity from X-Ray Images Using Image Filtering and Transfer Learning Approaches
DÜMF Mühendislik Dergisi
https://doi.org/10.24012/dumf.1611410The effect of a gamified flipped classroom model on reading comprehension and motivation in a primary school social studies course
Technology, Pedagogy and Education
https://doi.org/10.1080/1475939X.2025.2505763Problems Faced by PIKTES Teachers in Life Science Classes and Suggested Solutions
Uluslararası Türk Eğitim Bilimleri Dergisi
https://doi.org/10.46778/goputeb.1636512Development of a digital peer-feedback tool for clinical skills training: a pilot study with second-year medical students
Scientific Reports
https://doi.org/10.1038/s41598-025-24650-zEvaluation of foreign bodies in the maxillofacial region with cone beam computed tomography and ultrasonography: an ex vivo study
BMC Medical Imaging
https://doi.org/10.1186/s12880-025-02049-6Operating characteristics of agreement metrics in AI-based scoring: a Monte Carlo simulation
Frontiers in Psychology
https://doi.org/10.3389/fpsyg.2026.1705653Turkish Translation, Reliability, and Validity Study of Victim Gaslighting Questionnaire and Related Issues
Cyprus Turkish Journal of Psychiatry and Psychology
https://doi.org/10.35365/ctjpp.25.3.02