學(xué)業(yè)測評有兩種類型。
其中一種是評估政府的教育政績、評價教育的進程,這樣的測評一定是抽樣的。比如美國的“國家成績報告單”(NAEP),實際就是國家教育進步評估報告,這個報告的數(shù)據(jù)來源是通過全國抽樣的,反映的是整個美國按人口統(tǒng)計的整體狀況。如了解每天看4小時電視的兒童的成績怎么樣,每天領(lǐng)取免費午餐的中學(xué)生的成績怎么樣,在國外駐軍人員子女的成績怎么樣,私立學(xué)校學(xué)生怎么樣,天主教徒家庭學(xué)生怎么樣,等等。每年這個國家成績報告單公布的時候,國家電視網(wǎng)絡(luò)會在黃金時段加以評論。
另一種類型是對學(xué)生個人的測評,比如每個學(xué)生都要參加的統(tǒng)考。
目前,國內(nèi)的學(xué)業(yè)測評基本上還是紙筆考試,并且結(jié)果以分?jǐn)?shù)的方式表達。但從測量的角度講,這種方式將會被基于電腦網(wǎng)絡(luò)的考試所取代。紙筆考試的弊端是很多生動的材料無法反映出來,比如醫(yī)生資格考試中需要聽到心臟跳動的聲音,這在紙筆考試中就無法實現(xiàn),而用電腦就可實現(xiàn)。紙筆考試雖然也能進行學(xué)業(yè)測量,但是太落后了,一方面是手段上落后,無法呈現(xiàn)形象、環(huán)境等真實情境下的內(nèi)容,另外,考試也是一個很大問題。中國每年都在考試上花很大力氣,如有的考試保密室設(shè)三道鐵門,可還是會出問題。如果進行電腦化考試,建設(shè)大容量題庫,考試時試卷自動生成,問題就會解決,因為背一套試卷沒用,要偷整個試題庫并記住也不太可能。
此外,紙筆考試用一張試卷去測試所有學(xué)生,這可能對一些學(xué)生顯得太簡單,而對另外一些學(xué)生又太難,這樣就測不出學(xué)生真實水平,不知道真實水平就不能真正的了解學(xué)生,不能為學(xué)生提供幫助,尤其是差生。如果是零分試卷的話,就表明你將對這個學(xué)生一無所知。如果用網(wǎng)絡(luò)自適應(yīng)考試,根據(jù)學(xué)生答對答錯情況不斷調(diào)整試題,遇到學(xué)生不會的題目,系統(tǒng)自動降低標(biāo)準(zhǔn),一直降到會的程度,這樣才會測出學(xué)生真實水平?,F(xiàn)在的托福、GRE等都是這樣的模式。計算機介入學(xué)業(yè)測評將是一個趨勢。
現(xiàn)在內(nèi)地的許多學(xué)業(yè)測評只是滿足于把分?jǐn)?shù)測出來并對學(xué)生進行排隊,這實際是做到一半就停住了。應(yīng)該對這個成績進行分析,然后用于診斷與改進。通過計算機自適應(yīng)考試,建立診斷性模型,能的檢測出該學(xué)生的學(xué)習(xí)狀況??荚嚽敖處熀蛯<乙x這些題目要考查學(xué)生的什么能力。比如,測試學(xué)生的計算能力,一個學(xué)生考了70分,通過專家分析得出該學(xué)生加法和減法還可以,乘法稍差,除法一點都不行,學(xué)生的老師一看到相關(guān)的信息馬上就知道需要在哪些方面幫助這個學(xué)生,做到“對癥下藥”。