Tekil Mesaj gösterimi
Alt 06-04-2007, 11:12   #2
webmaster
Administrators
 
webmaster - ait Kullanıcı Resmi (Avatar)
 
Üyelik tarihi: Oca 2007
Bulunduğu yer: Malatya
Mesajlar: 4.804
Teşekkürleriniz: 0
139 Mesajına 245 teşekkür edildi.
Tecrübe Puanı: 10
webmaster is on a distinguished road
Standart

ÖLÇME ARAÇLARININ SAHİP OLMASI GEREKEN NİTELİKLER = o ns = />
<H2 MARGIN: 0cm 0cm 0pt"> I-GEÇERLİLİK
Bir ölçme aracının ölçmeyi amaçladığı özelliği ölçüp başka özellikleri ölçmemesine geçerlilik denir. Saat zamanı ölçmek için geliştirilmiş bir ölçme aracıdır ve biz saati insanların boyunu ölçmek için kullanmayız. Saat zamanı ölçtüğü zaman geçerli sonuçlar vermektedir. Saatle başka özellikleri ölçmeye kalktığımızda geçerli olmayan sonuçlar elde ederiz.
Psikolojik özelliklerin ölçülmesinde kullanılan ölçme araçlarını düşündüğümüzde geçerlilik daha fazla anlam kazanır. İnsanların zekası ölçmek için geliştirilmiş bir test aynı zamanda insanların okuma hızlarını da ölçülüyorsa bu zeka testinin geçerliliği düşüktür deriz. Aynı şekilde bu zeka testi okuma hızı yüksek olan kişilerin daha yüksek puan almasını sağlamıyorsa ve başka diğer özellikleri de ölçmüyorsa sadece zekayı ölçülüyor, bu zeka testinin geçerliliği yüksektir deriz.
Geçerliliğin belirli dereceleri vardır, yani bir ölçek yüksek geçerliliğe, orta düzeyde geçerliliğe ya da düşük geçerliliğe sahip olabilir. Bir ölçek için sadece geçerlidir ya da geçersizdir denilmez. Herhangi bir ölçek geçerliliğin yüksek, düşük ya da orta gibi bir derecesine sahiptir.
Bir ölçeğin geçerliliğini belirlemek için çeşitli yöntemler geliştirilmiştir. Bu yöntemler geliştirilen ölçeğin ne amaçla kullanılacağına bağlı olarak değişir.

1. Kapsam Geçerliliği:
Özellikle eğitimde, amaçlanan, öğrencilere eğitim programının kazanmayı amaçladığı davranışları mümkün olduğunca kazandırmak. Örneğin coğrafya dersiyle verilen coğrafya eğitimi, öğrencilerin bu eğitim sonunda dünyayı coğrafya dersinin konularının anlatıldığı şekilde anlamasını amaçlar. Buna göre öğrencilerin bu eğitim sonunda örnek olarak dağların oluşumunu coğrafya dersinde anlatılığı gibi açıklama davranışı göstermesi istenir.
Burada dağların oluşumu örnek olarak verilmiştir. Fakat eğitim programının içinde mesela coğrafya dersinin programında çok konu vardır. Bu konular öğrenciye belirli davranışlar kazandırmayı amaçlar. Bu ders sonunda coğrafya dersinin kazandırmayı amaçladığı davranışların ne kadarının öğrenciler tarafından kazanıldığını belirlemek için bir test geliştirildiğini düşünelim. Bu testin, bu derste kazandırılmaya çalışılan davranışların hepsini belirli oranda içinde barındırması yani kapsaması gerekir.
Bu davranışların ne kadarının kazanıldığının belirlenmesi için farklı biçimde binlerce soru yazılabilir. Fakat bir test binlerce sorudan oluşamaz. Bu nedenle maddenin yaptığı işin aynısını yaptığını düşünülen ama daha az sayıda madde yazılır. Kapsam geçerliliği de işte bu az sayıdaki maddenin o konuyla ilgili yazılabilecek binlerce maddeyi ne kadar temsil ettiğidir.
Kapsam geçerliliğini saptamak içi 2 faklı yol vardır.
a) Rasyonel (Mantıksal) Yaklaşım
b) İstatistiksel Yaklaşım

Rasyonel Yaklaşım: Özellikle eğitimde testler konuları ve kazandırılmak istenilen davranışları içeren belirtke tablosuna göre geliştirilir. Bu tabloya bakılarak testteki sorunların her bir davranışta belirli oranda yer alması sağlanarak kapsam geçerliliği için bir çalışma yapılmış olur. Ayrıca her bir soru (madde) tek tek incelenerek aynı ders kapsamı içinde kalmak şartıyla diğer sorulardan (maddelerden) farklı bir davranışı ölçüp ölçmediği saptanabilir. Bu çalışmada kapsam geçerliliği için bir kanıt sağlar. Bu iki çalışma dışında, geliştirilen test, dersle ilgili uzmanlara ya dersi anlatan öğretmenlere gösterilerek testin ölçülmek istenilenleri ölçüp ölçmediğine dair görüşlerinin alındığı bir kapsam geçerliliği çalışması da yapılabilir.
İstatistiksel Yaklaşım: Eğer biz bir alanda geliştirilmiş olan ve kapsam geçerliliğinin yüksek olduğunu bildiğimiz bir testle kendimizin geliştirdiği testi aynı öğrencilere uygulayıp öğrencilerin bu testlerden aldıkları puanlar arasındaki korelasyonu (ilişkiyi) hesaplarsak ortaya çıkan korelasyon değerini kendi testimizin kapsam geçerliliğinin derecesi olarak yorumlayabiliriz.
İstatistiksel yaklaşımla kapsam geçerliliğini belirlemeye yönelik ikinci bir çalışma testimizin, testin geliştirildiği alanda başarılı ya da başarısız öğrencileri ayırt edip etmediğinin belirlenmesi yöntemiyle de yapılabilir. Geliştirdiğimiz testi yıl sonunda öğretmenin verdiği notlar bakımından başarılı ve başarısız öğrencilere uygulayıp bu iki grubun bu testten aldıkları puanların ortalamalarını karşılaştırabiliriz. Başarılı grubun ortalaması başarısız grubun ortalamasından istatistiksel olarak anlamlı derecede büyük ise testin kapsam geçerliliği için kanıt toplamış sayılırız. Kapsam geçerliliği için yapılan istatistiksel çalışma her bir maddenin ölçmek istediği davranışı ölçüp ölçmediği ile ilgilenmez. Tek tek maddelerin incelenmesi kapsam geçerliliğinin sağlanması için gereklidir. Böyle bir durum kapsam geçerliliğini sağlamanın daha çok bir akıl yürütme sorunu olduğunu gösterir.
2- Yordama Geçerliliği:
Yordama, belirli bilgilere dayanarak ve belirli teknikler uygulayarak geleceği ilişkin tahminde bulunmak demektir. Burada bahsedilen belirli teknikler, bilimsel teknikler olarak anlaşılmalıdır. Tekrar söyleyecek olursak, yordama istatistiksel teknikler kullanarak ve bilinenden yola çıkılarak bilinmeyen olaylar ve durumlar hakkında geleceğe yönelik tahmin yapma işlemidir.
Özellikle eğitim yordama, bir öğrencinin ya da bir öğrenci grubunun gelecekte ne derece başarı göstereceğini tahmin etmek için kullanılır. Örneğin, okula henüz başlamamış bir öğrencinin zeka testinden aldığı puanın, okuldaki başarı durumunun ne olacağını tahmin etmeye yönelik çalışma yordama çalışmasıdır. Yordama geçerliliği ise bir testin kişilerin o alanda gelecekteki başarısını ne derecede doğru olarak tahmin ettiğidir.
Yordama geçerliliğine ilişkin kanıt toplama süreci 2 şekilde olabilir.
Yordama geçerliliğini belirlemeye çalıştığımız test uygulanır ve o testin yordayacağı özellik ortaya çıkana kadar beklenir. Varsayalım ki ÖSS testinin üniversitedeki başarısını yordama derecesini bulmak istiyoruz.
ÖSS testi uygulandıktan sonra kazanan öğrencilerin üniversite 1. sınıf botları belli oluncaya kadar beklenir bu notlar belli olunca öğrencilerin ÖSS puanları ile derslerden aldıkları puanlar arasındaki korelasyon (ilişki) hesaplanır. Elde edilen korelasyon değeri ÖSS testinin üniversitedeki başarıyı yordama derecesi olarak kabul edilir. Dikkat edilecek olursa öğrencilerin ÖSS puanları, aynı öğrencilerin ders notlarıyla karşılaştırılmıştır. Burada öğrencilerin ÖSS puanları yordayıcı, ders başarıları ise ölçüt olarak adlandırılmaktadır. Ders başarısının gösteresi ise öğrencilerin derslerden aldıkları puanlardır. Bu puanlara da ölçüt ölçüsü denir. Ölçüt ölçüsü testin yordamaya çalıştığı psikolojik değişkenle ilişkili olmalıdır ve günden güne değişmemelidir. Ayrıca ölçüt ölçüsü nesnel olmalıdır ve sağlanması kolay olmalıdır.
Kimi kez yoradyıcılık derecesi saptanmaya çalışılan testin karşılaştırılacağı ölçüt beklemeye gerek kalmadan halihazırda elimizde bulunabilir. Örneğin, bir dershanenin ÖSS’den birkaç gün önce yaptığı deneme testinin ÖSS’deki başarıyı yordama derecesi saptanırken yordayıcı test de ölçüt de hemen hemen aynı zamanda bir arada bulunmaktadır. Bu tüm durumlarda hesaplanan geçerlilik türü halihazır geçerlilik (mevcut hal geçerliliği) olur.
3- Yapı geçerliliği:
Yapı, birbirleriyle ilişkili olduğu düşünülen belirli öğelerin ve bu öğeler arası ilişkilerin oluşturduğu bir örüntüdür. Eğitimde ve psikolojide kullanılan ölçekler de benzer şekilde aralarında belirli ilişkilerin olduğu öğelerin oluşturduğu “yapı”ları ölçmeye çalışırlar. Zeka, bir yapıdır. Kendine özgü alt öğeleri vardır ve bu öğeler birbirleri arasında ilişkilidir. Biz bu öğeler arasında olduğunu düşündüğümüz ilişkinin aynısını o özelliği ölçen testten elde ettiğimiz veriler arasında da görmek isteriz. Bir anlamda yapı geçerliliği çalışmasında ölçmeye çalıştığımız özelliği nasıl tanımladıysak testin de bize bu tanıma uygun veri sağlanmasını bekleriz. Çoğu kez yapı geçerliliği için faktör analizi tekniği ile anıt aranır. Son olarak söylenecek bir nokta da yapı geçerliliği çalışmasının bir kuram sınamaya ya da geliştirme süreci olarak düşünebileceğidir.

4- Görünüş Geçerliliği:
Bir testin, ne ölçüyor göründüğünü o testin görünüş geçerliliğidir. Soruların tümü matematikle ilgili olan bir matematik testinin görünüş geçerliliği vardır denilebilir. Bir testin incelendiğinde ölçmek istediği özelliği ölçüyor görünmesi bu testin görünüş geçerliliğine kanıt oluşturacaktır. Fakat bazı durumlarda görünüş geçerliliği gizlemek zorunda kalınabilir. Örneğin kişiliği hakkında ayrıntılı bilgi vermek istemeyen kişilerden kişilik ölçeği ile bilgi toplarken bu testin kişilik ölçeği olduğuna dair bilgilerin gizlenmesi gerekebilir.

II- GÜVENİRLİK
Bir ölçme aracının, ölçme sonuçlarına hata karıştırmadan ölçme yapabilmesi güvenilirliktir. Burada hata olarak adlandırılan şey ölçme aracının ölçmek istediği özellikleri ölçmesidir. Tekrar söylenirse, güvenilirlik ölçme aracının hatlardan arınık olması yeterlidir. Güvenilirlik, hatasızlık miktarını gösterir. Bir ölçme aracının ölçümlerine pek çok yerden hata karşılanabilir.
HATA TÜRLERİ
a) Sabit Hatalar: Ölçmeden ölçmeye hep aynı miktarda karışan hatalara sabit hatalar denir. Öğretmenin her puanladığı cevap kağıdına 10 puandan fazla vermesi sabit hataya örnektir. Ya da bir terazinin ne tartarsa tartsın 15 gram fazla tartması sabit hatadır.
b) Sistematik (sistemli) Hata: Bir metrenin her 100 cm’de 2 cm fazla ölçme yapması ya da bir öğretmenin yazısı güzel olanlara fazla puan vermesi sistematik hataya örnektir. Sistematik hatalar çoğu kez puanlama yapan kişinin yanlılığını gösterirler.
c) Tesadüfi (rasgele) Hata: Nereden kaynaklandığı ve ölçme aracının ölçme sonuçlarını arttırıcı mı yoksa azaltıcı mı yönde etkide bulunduğu ilinmeyen hatalardır. Zaman zaman puanlayanın dikkatsizliğiyle ortaya çıkan hatalar bu türden hatalardır.
Güvenirliliğin Anlamları
Güvenirliliği daha önce bir ölçme aracının ölçme sonuçlarına hata karıştırmadan ölçme yapabilmesi olarak tanımlamıştık. O halde biz bir ölçme aracını farklı zamanlarda uygulayıp bu sonuçların birbirine ne kadar benzediğine bakarsak ölçmelerimize karşın hataları da görebiliriz demektir. Eğer bizim sonuçlarımız bir ölçmeden diğer ölçmeye çok büyük farklar gösteriyorsa demek ki ölçmelerimize hata karışmaktadır. Diğer bir anlamıyla güvenilirlik ölçmeler arsındaki tutarlılık denilebilir.
Güvenilirlik katsayının Belirlenmesi
Güvenilirlik katsayısının tespit edilmesi için birden fazla yol bulunmaktadır. Bu yollar aşağıda anlatılmıştır.
1. Tekrarlı ölçümle güvenilirlik kestirimi:
Bu yöntemde güvenilirlik katsayısı tahmin edilecek test aynı gruba belirli bir zaman aralığıyla iki kez uygulanır. Birinci uygulamadan elde edilen puanlarla ikinci uygulamadan elde edilen puanlar arasındaki ikinci uygulamadan elde edilen puanlar arasındaki korelasyon hesaplanır. Bu korelasyon değeri ölçeğin güvenilirlik katsayısını gösterir.
Korelasyon katsayısı – 1.00 ile + 1.00 arasında değişir, fakat katsayısı kuramsal tanımı gereği 0.00 ile +1.00 arasında değişir. Eğer iki ölçüm arasında hiçbir ilişki yoksa güvenilirlik katsayısı 0.00 olacaktır. Bu durum ölçmelerimizin tamamının hatadan oluştuğu anlamına gelir. Eğer ölçeğimizin iki uygulaması arasındaki ilişki mükemmelce güvenirlilik katsayısı +1.00 olacaktır. Bu da ölçmelerimize hiç hata karışmadığı anlamına gelir. Fakat insan üzerinden bilgi toplayan testlerin hatalardan arınık ölçme yapabilmesi mümkün olmadığından güvenirliliği + 1.00 olan testler geliştirmek neredeyse imkansızdır. Tekrarlı uygulamalarda, uygulamalar arasındaki zaman da güvenilirlik katsayısının doğru tahmin edilebilmesi için önemlidir. Aynı testin 1 gün arayla uyguladığımızda da öğrenciler dün verdikleri cevapları hatırlayacaklar ve güvenilirlik katsayısı yapay olarak + 1.00’e yaklaşacaktır. Testin 1 yıl arayla uyguladığımızda da ölçmeye çalıştığımız özellik değiştiği için güvenilirlik katsayısı 0.00’a yaklaşacaktır. Bu nedenle ölçmeler arasındaki zaman, unutma ve değişme etkileri oluşmadan ve hatırlama etkisi işin içine karışmadan olacak şekilde belirlenmelidir.
Testin aynı gruba iki kez verilmesinden elde edilen sonuçlar ölçülen özelliğin kararlığını gösterdiği için hesaplanan güvenirlilik katsayısı kararlılık katsayısı olarak da adlandırılır.
2. Paralel Testler:
Bu yöntemle güvenirlilik katsayısı hesaplanırken bir testin eşdeğer formu geliştirilir. Eşdeğer form demek madde sayısı, maddelerin ölçtüğü davranışlar ve maddelerin niteliği bakımından testlerin birbirine denk olması demektir. Bu iki test aynı psikolojik değişkeni (başarı, yetenek vs.) ölçerler. Güvenilirlik katsayısı şu yöntemle şu şekilde saptanır. İki paralel test aynı öğrenci grubuna aynı zamanda verilir ve bu iki testten elde edilen puanlar arasındaki korelasyona bakılır. Böylece bu testlerin eşdeğerlik katsayısı hesaplanmış olur. Aynı testler aynı öğrenci grubuna farkı zamanlarda verilirse hem testlerin eşdeğerliği hem de ölçülen özelliğin ne derecede kararlı olarak ölçüldüğüne ilişkin bilgi toplanmış olunur.
3. Testi Yarıya Bölme Yönetimi:
Bu yöntem güvenilirlik katsayısının tahminde diğer yöntemlere oranla daha hızlı ve kolay bir yol sağladığı en çok kullanılan yöntemdir.
Bu yöntemin temel varsayımı testin içindeki tüm maddelerin aynı psikolojik özelliği ölçtüğü yönündedir. Bu nedenle hepsi aynı şeyi ölçen soruların korelasyonun hesaplanması, testi oluşturan maddelerin testin genel amacına bağlı olarak kendi içlerinde ne derecede tutarlı ölçme yaptıklarını gösterecektir. 50 sorudan oluşan bir matematik testinin soruları 1.,3.,5., gibi tek numaralı sorular şeklinde iki gruba ayrılırsa ve bu iki grup sorudan elde edilen puanlar arasında korelasyon hesaplanırsa elde edilen katsayı tüm testi ikiye bölerek elde ettiğimiz yarım testlere ait korelasyon katsayısını yani yarım testlerin güvenilirliğini verecektir. Bizim tüm testin güvenilirliğini hesaplamamız için başka bir işlem yapmamız gerekecektir.
Güvenilirliği Etkileyen Faktörler
Güvenirliği testin uzunluğu, testin yönergesi, testi oluşturan maddelerin homojenliği gibi etmenler etkiler. Test uzatılırsa güvenirlik artar ama belirli bir yerden sona güvenilirlik çok büyük artışlar gösteremez. Testin uzatılması testteki madde sayısının arttırılması anlamına gelir. Testin yönergesi diğer testin tanıtımını yeterince yapamıyorsa testi alanlar testteki maddeleri nasıl yanıtlayacaklarını bilemedikleri için testin güvenilirliği düşük çıkabilir. Testi oluşturan maddeler birbirine benzemiyorsa yani aynı davranışları ölçüyorsa güvenilirlik yükselir fakat birbirinden bağımsız davranışları ölçen testlerin güvenilirlikleri düşük olma eğilimindedir.

<H3 MARGIN: 0cm 0cm 0pt">III- KULLANIŞLİLİK
Kullanılacak ölçeğin hazırlanmasının, çoğaltılmasının, kullanılmasının ve puanlanmasının kolay olmasıdır.
__________________
webmaster isimli Üye şimdilik offline konumundadır   Alıntı ile Cevapla
 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159