在測(cè)驗(yàn)統(tǒng)計(jì)中還經(jīng)常用到標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差是表征一組測(cè)驗(yàn)數(shù)據(jù)的離散程度的量,用s表示。
2.物理測(cè)驗(yàn)的評(píng)價(jià)指標(biāo):信度、效度、難度和區(qū)分度
(1)信度
信度是指一次測(cè)驗(yàn)結(jié)果穩(wěn)定性、可靠性的程度,是描述一份試卷可靠性指標(biāo)。信度的計(jì)算方法很多,這里只介紹一種實(shí)際應(yīng)用較多的折半法,即折半信度的計(jì)算方法。首先將一份試卷分成盡可能等值的兩半(可將試卷按奇、偶數(shù)分成兩份),使這兩份試卷考查目的、內(nèi)容、題型、題數(shù)、難度分布、分值分配等相同或大致相同,這樣就相當(dāng)于把其中的一半試卷在相同的條件下,對(duì)同一批學(xué)生考了兩次,從而考查考生在兩半測(cè)驗(yàn)上得分的一致程度。先計(jì)算兩半測(cè)驗(yàn)的關(guān)聯(lián)程度(即相關(guān)系數(shù)),用r表示。若考生總數(shù)為n,用 表示兩組試卷分?jǐn)?shù),則:
( )
最后用斯皮爾曼-布朗公式求出折半信度:
測(cè)驗(yàn)的折半信度為0.8為基本合格。影響信度的主要因素主要有評(píng)分的標(biāo)準(zhǔn)和試題數(shù)量,要提高信度,就要求排除評(píng)分的主觀隨意性,客觀評(píng)分;題量要足夠多。
(2)效度
效度是測(cè)驗(yàn)的準(zhǔn)確性指標(biāo)。效度可分為兩類,一類稱為內(nèi)容效度,另一類稱為效標(biāo)效度,對(duì)學(xué)生學(xué)業(yè)成就測(cè)驗(yàn)考查的指標(biāo)主要是內(nèi)容效度,所謂內(nèi)容效度是指測(cè)驗(yàn)內(nèi)容對(duì)所要測(cè)量?jī)?nèi)容的相符程度。分析內(nèi)容效度從以下兩方面考慮:
①要從測(cè)驗(yàn)的教材內(nèi)容范圍(覆蓋面)和教育目標(biāo)以及它們所占的比例分析。
②考查題目?jī)?nèi)容與命題的雙向細(xì)目表是否相符,參考答案、評(píng)分標(biāo)準(zhǔn)是否合理。
(3)難度
難度指測(cè)驗(yàn)的難易程度,難度的數(shù)值用P表示。
對(duì)選擇題或判斷題(也稱二值性試題),若總?cè)藬?shù)為n,某題答對(duì)人數(shù)為R,難度的計(jì)算公式為
對(duì)于非選擇題和判斷題(非二值性試題),可用某個(gè)題目所得的平均數(shù) 的比值來(lái)計(jì)算難度的數(shù)值。
這里計(jì)算的難度數(shù)值實(shí)際指通過(guò)率,P值越大,難度則越小;P值越小,難度則越大。一般P值在0--0.3之間為較難;在0.3--0.7之間為適中;在0.7--1.0之間為較易。
(4)區(qū)分度
區(qū)分度指題目對(duì)不同學(xué)生的區(qū)分程度(或鑒別力)。
區(qū)分度計(jì)算方法很多(曲線法、相關(guān)法、極端組法)常用的方法是極端組法,計(jì)算步驟如下:
首先將全體學(xué)生按總分由高到低的順序排列(大數(shù)量考生可采取抽樣排序),其次將前面占總體學(xué)生人數(shù)的27%的試卷劃為一組,稱為高分組,后面占總體學(xué)生人數(shù)的27%試卷劃為一組,稱為低分組,則區(qū)分度(用D表示)為某題高分組通過(guò)率PH 與低分組通過(guò)率PL的差值。
或 (二值性試題,n為高分組或低分組的人數(shù));
(非二值性試題)
一般認(rèn)為用極端組法求得的區(qū)分度數(shù)值在0.40以上為優(yōu)秀;0.30--0.39 較好;0.20--0.29 需改進(jìn),0.19以下認(rèn)為不可使用,區(qū)分度差。
難度與區(qū)分度有密切的關(guān)系。一般情況下難度適中的題目,區(qū)分度都較高,太難、太易的題目,區(qū)分度都較低。
交流與討論:
(1)你認(rèn)為適宜難度的試題對(duì)測(cè)驗(yàn)有哪些作用?
(2)你認(rèn)為傳統(tǒng)的教學(xué)測(cè)驗(yàn)和學(xué)業(yè)成就評(píng)價(jià)有哪些不合理的地方?
三、標(biāo)準(zhǔn)分?jǐn)?shù)
一般情況下,由測(cè)驗(yàn)的實(shí)際分?jǐn)?shù)不能看出考生在團(tuán)體中的位置,有必要將實(shí)際分?jǐn)?shù)轉(zhuǎn)化為標(biāo)準(zhǔn)分?jǐn)?shù),標(biāo)準(zhǔn)分?jǐn)?shù)是以標(biāo)準(zhǔn)差為單位,表示一個(gè)分?jǐn)?shù)在團(tuán)體中的相對(duì)位置。
標(biāo)準(zhǔn)分?jǐn)?shù)用符號(hào)Z表示,也稱Z分?jǐn)?shù),計(jì)算公式為
其中s是這組分?jǐn)?shù)的標(biāo)準(zhǔn)差, 是一組分?jǐn)?shù)的平均數(shù), 是某一原始分?jǐn)?shù)。標(biāo)準(zhǔn)分?jǐn)?shù)可得正值,可為負(fù)值。平均數(shù)以上的各數(shù)的Z分?jǐn)?shù)為正;平均數(shù)以下各數(shù)Z分?jǐn)?shù)為負(fù);等于平均數(shù)時(shí),Z分?jǐn)?shù)為零。
標(biāo)準(zhǔn)分?jǐn)?shù)的應(yīng)用主要在于確定原始分?jǐn)?shù)在分?jǐn)?shù)分布中的相對(duì)地位;也可接受代數(shù)運(yùn)算,有廣泛的應(yīng)用。
例如:某班學(xué)生李紅在期中、期末考試中,語(yǔ)文成績(jī)分別是88和84,物理成績(jī)分別是77和80,是否由此可得結(jié)論:李紅物理學(xué)習(xí)有進(jìn)步,語(yǔ)文學(xué)習(xí)有退步?(各科班級(jí)平均分、標(biāo)準(zhǔn)差已知,見(jiàn)表7-3)
表7-3
科目 班級(jí)平均分 班級(jí)標(biāo)準(zhǔn)差s 李紅原始分?jǐn)?shù) 李紅標(biāo)準(zhǔn)分Z
期中 期末 期中 期末 期中 期末 期中 期末
語(yǔ)文 80 74 8 8 88 84
物理 66 69 9 9 77 80
解:這是對(duì)同科不同次考試成績(jī)進(jìn)行比較的問(wèn)題,用標(biāo)準(zhǔn)分?jǐn)?shù)進(jìn)行分析。
把數(shù)值代入式 得
Z語(yǔ)中=(88-80)/8=1 ,Z物中=(77-66)/9=1.22 ,
Z語(yǔ)末=(84-74)/8=1.25 ,Z物末=(80-69)/9=1.22
結(jié)果說(shuō)明,李紅的語(yǔ)文考試分?jǐn)?shù)雖然降低了,但標(biāo)準(zhǔn)分?jǐn)?shù)從1升至1.25,也就是相對(duì)位置升高了。物理考試分?jǐn)?shù)雖然提高了,但標(biāo)準(zhǔn)分一樣,即相對(duì)位置沒(méi)有變化,因此不能簡(jiǎn)單地認(rèn)為李紅語(yǔ)文學(xué)習(xí)退步了,物理學(xué)習(xí)有進(jìn)步。
在高考招生中,通常采用各科成績(jī)相加比較總分高低的辦法來(lái)錄取學(xué)生,使用范圍較廣泛。但卻有不夠合理、不夠科學(xué)的成分。這是因?yàn)楦鱾(gè)學(xué)科考試試題的難易程度總不會(huì)相同,評(píng)分標(biāo)準(zhǔn)也不一樣,這必然形成有的科目的考分偏高,有的科目考分偏低,因此各科目的分值并不相同。這種情況下,將各科成績(jī)相加求和,比較總分就不合理了。如果先將各原始分?jǐn)?shù)轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù),不管各科目的原始分?jǐn)?shù)的平均分和標(biāo)準(zhǔn)差有多不同,一經(jīng)轉(zhuǎn)化成標(biāo)準(zhǔn)分?jǐn)?shù),就變?yōu)橐云骄鶖?shù)為零,標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)形式。也就是說(shuō),各科的標(biāo)準(zhǔn)分?jǐn)?shù)的單位都相同。因此,將考生的各科標(biāo)準(zhǔn)分相加求和,來(lái)比較總分的高低就比較科學(xué)合理了。
在標(biāo)準(zhǔn)分?jǐn)?shù)Z的應(yīng)用中,由于標(biāo)準(zhǔn)分?jǐn)?shù)Z分值過(guò)小,并往往帶有小數(shù)和負(fù)值等缺陷,在許多情形下直接使用不大合乎人們表示分?jǐn)?shù)的習(xí)慣,故通常把標(biāo)準(zhǔn)分?jǐn)?shù)Z通過(guò)線性變換,轉(zhuǎn)到更大的標(biāo)準(zhǔn)分?jǐn)?shù)量表上,其一般轉(zhuǎn)換公式為:
T=a+bZ
上式中,a和b為選定的兩個(gè)常數(shù),Z為標(biāo)準(zhǔn)分?jǐn)?shù),T為線性變換的標(biāo)準(zhǔn)分?jǐn)?shù)。常見(jiàn)的有如下幾種:
①教育與心理測(cè)驗(yàn)中的T分?jǐn)?shù):T=50+10Z
②韋氏智力量表中各分測(cè)驗(yàn)的量表分:T=10+3Z
韋氏智力量表智商(離差智商):IQ=100+15Z
③美國(guó)大學(xué)入學(xué)考試報(bào)告分?jǐn)?shù):CEEB=500+100Z
④為出國(guó)人員舉行的英語(yǔ)水平考試:EPT=90+20Z
⑤美國(guó)教育測(cè)驗(yàn)中心舉辦“托!笨荚嚕篢OEFL=500+70Z