Tezin Türü: Yüksek Lisans
Tezin Yürütüldüğü Kurum: Akdeniz Üniversitesi, Eğitim Bilimleri Enstitüsü, Türkiye
Tezin Onay Tarihi: 2023
Tezin Dili: Türkçe
Öğrenci: FATMA ÜNAL
Danışman: Hakan Koğar
Özet:
Bu araştırmada kayıp veri atama yöntemlerinden regresyon atama (RA), çoklu atama (ÇA) ve k-en yakın komşu (kNN) yöntemlerinin değişen madde fonksiyonuna (DMF) etkisinin incelenmesi amaçlanmıştır. Bu doğrultuda PISA2018 fen okuryazarlığı testinden 14 ve 15 numaralı kitapçığı yanıtlayan Türkiye, Birleşik Krallık, ABD, Yeni Zelanda, Avustralya’daki 600 öğrenciden elde edilen tam veri setlerine tamamen rastgele kayıp (TRK) mekanizması altında veriler silinerek araştırmada kullanılan veri setleri oluşturulmuştur. Kayıp verilerin bulunduğu veri setlerine RA, ÇA ve kNN yöntemleriyle veri ataması yapılmış ve oluşturulan bütün veri setlerine Lord’un yöntemi, Raju’nun alan ölçümleri yöntemi ve madde tepki kuramı olabilirlik Oran (MTK-OO) yöntemiyle dil ve cinsiyet değişkenlerine göre DMF analizi yapılmıştır. Tam veri setlerinde elde edilen DMF sonuçları referans alınarak diğer veri setlerinden ulaşılan sonuçlarla karşılaştırma yapılmıştır. Araştırma sonucunda RA atama yönteminde, dil değişkenine göre yapılan DMF analizi doğrultusunda %10 oranında diğer oranlara göre daha iyi sonuç verirken doğru sonuca yakın tespitlerde bulunulmuştur. %5 oranında, %20 ve %30 oranlarına göre nispeten doğru sonuçlar elde edildiği görülürken %20 ve %30 oranlarında ise kötü sonuçlar elde edilmiştir. RA yöntemi ile cinsiyet değişkenine göre %10 oranında doğru sonuca yakın değerler elde edilmesine karşın diğer oranlarda yanlış sonuçlara ulaşılmıştır. ÇA ve kNN yöntemlerinde dil değişkenine göre %5 kayıp veri oranında tam veri setine en yakın sonuçlar elde edilirken, %20 kayıp veri oranında %10 ve %30 kayıp veri oranlarına göre daha doğru kestirimlerde bulunulduğu görülmüştür. ÇA yönteminde cinsiyet değişkenine göre bütün kayıp veri oranlarında yanlış sonuçlar elde edildiği tespit edilmiştir. Cinsiyet değişkenine göre DMF analizi doğrultusunda KNN yönteminin %5 ve %10 kayıp veri oranlarında doğru sonuçlar verdiği ancak %20 ve %30 oranlarında yanlış kestirimler yapıldığı görülmüştür. RA, ÇA ve kNN yöntemleri ile %5 kayıp veri oranında dil değişkenine göre DMF belirlemede ÇA ve kNN yöntemlerinin tam veri setine yakın bulgulara ulaşıldığı, RA yönteminin ise diğer yöntemlere göre hatalı sonuçlar verdiği ortaya çıkmıştır. %10 eksik değer oranında dil değişkenine göre tam veri setine en yakın sonuç RA yönteminde elde edilirken ÇA ve kNN yöntemlerinde hatalı bulgular elde edildiği belirlenmiştir. %20 oranında dil değişkenine göre DMF analizi sonucunda ÇA ve kNN yöntemleri aynı oranda sonuçlar elde edilmiş olmasına rağmen DMF tespit etmek için yeterli kestirimde bulunmamışken, RA yönteminde bu yöntemlere göre daha yanlış değerler belirlenmiştir. %30 eksik değer oranında dil değişkenine göre üç yöntem için de benzer sonuçlar ortaya çıkmasına karşın doğru yanıtlar elde edilememiştir. %5 oranında cinsiyet değişkenine DMF analizleri sonucunda ÇA ve RA yöntemlerinde hiçbir maddede DMF belirlenemezken, kNN yönteminde ise tam veri seti ile aynı sonuca ulaşılmıştır. %10 oranında cinsiyet değişkenine göre ÇA yönteminde hatalı sonuçlara ulaşılırken, RA ve kNN yöntemlerinde ise doğru kestirimlerde bulunulmuştur. %20 ve %30 eksik değer oranlarında cinsiyet değişkenine göre üç yöntemde de (RA, ÇA, kNN) doğru sonuçlara ulaşılamamıştır.