測評大數(shù)據(jù) 重新認識中學(xué)教育
- 來源:中國信息化周報 smarty:if $article.tag?>
- 關(guān)鍵字:競爭,模式,改善 smarty:/if?>
- 發(fā)布時間:2020-05-02 15:33
“學(xué)習(xí)性評價”于1998年在國際教育界首次提出,隨后《黑箱內(nèi):通過課堂評價來提升標(biāo)準(zhǔn)》發(fā)表,國際教育界開始了“學(xué)習(xí)性評價”的推廣應(yīng)用,掀起一場學(xué)校教育的革新。近十來年,“測評與學(xué)習(xí)”也受到中國教育界關(guān)注。但是,相對而言,中文里的測試、考試(或測評)、評價等詞的含義,更接近英語單詞test、assessment、evaluation。在中國的學(xué)校教育中還難以看到“形成性評價”“以學(xué)習(xí)為導(dǎo)向的評價”等模式的實踐,更多的還是各種傳統(tǒng)的學(xué)科測驗,以及被學(xué)生戲稱為“周周爽”“月月爽”的考試。新高考推行后,逐年形成的大數(shù)據(jù),使得測評對教與學(xué)的提升成為可能。
競爭性測評
推動應(yīng)試學(xué)習(xí)模式
雖說不斷進步的技術(shù)保證了大規(guī)模測評的科學(xué)性、客觀性,其標(biāo)準(zhǔn)化、集約化的高效率也很好地回應(yīng)了社會與公眾的要求。但是眾所周知,這種由一次測試決定結(jié)果的終結(jié)性評估方式只能反映被測學(xué)生過去的積累,而并非全部能力,也無益于學(xué)生在學(xué)習(xí)上的自我完善與能力提升,反而會引起更大的考試焦慮,形成強烈的應(yīng)試學(xué)習(xí)模式。
以最近四十多年的高考為例,過去極低的錄取率使升學(xué)競爭十分激烈。盡管高考是由多門科目的測試所組成,但較之單門科目分數(shù)的得失,人們往往更關(guān)心總分,對總分的關(guān)心也是集中于其在總體中的排名是否達到了大學(xué)的錄取分數(shù)線標(biāo)準(zhǔn)。
雖然命題專家圍繞課程標(biāo)準(zhǔn)、教學(xué)狀況和高校選拔要求對各科試卷進行了精心開發(fā)與設(shè)計,也對考試過程和評卷質(zhì)量進行了精確控制,但結(jié)果僅僅是各門科目總分的反映,實在令人非常無奈。由此所形成的以模擬考試代替教學(xué)的高強度應(yīng)試局面也是必然的結(jié)果。
新高考為測評發(fā)揮正向作用提供基礎(chǔ)。從1999年起,國家增加高等教育投入,不斷擴大大學(xué)的招生規(guī)模,使得高考的錄取率連年提高,各地區(qū)普遍在80%左右甚至有超過90%,但是業(yè)已形成的應(yīng)試教育模式難有根本改觀,高中學(xué)生普遍是早晨7點踏進教室、晚上9點離開學(xué)校。
正是在這樣的背景下,國家堅決推出了高考綜合改革方案。從測評的視角看,新高考被分成了兩個部分:即所有學(xué)生參加的語文、數(shù)學(xué)、外語科目的統(tǒng)一考試,與思想政治、歷史、地理、物理、化學(xué)、生命科學(xué)科目的高中學(xué)業(yè)水平考試。
而高中學(xué)業(yè)水平考試又根據(jù)學(xué)習(xí)的深入程度分為統(tǒng)一參加的合格性考試和選擇其中三門參加的等級性考試。即把一部分科目的測評以常模參照呈現(xiàn),作為個體學(xué)生與其他學(xué)生的比較,而另一部分科目的測評以標(biāo)準(zhǔn)參照呈現(xiàn),以期降低測評整體的競爭性。因為學(xué)業(yè)水平考試的標(biāo)準(zhǔn)參照還是與得分率分布相聯(lián)系,依然呈現(xiàn)出高利害性。但是學(xué)業(yè)水平考試的定位與設(shè)計,評價維度與指標(biāo)體系,使得評價標(biāo)準(zhǔn)的意義得到體現(xiàn),為測評對教學(xué)和學(xué)習(xí)的正向反撥奠定制度基礎(chǔ)。
測評提升高中教育質(zhì)量
就上海而言,2014年啟動新高考,由于政策、環(huán)境的穩(wěn)定,特別是高考總分分布的穩(wěn)定可期,促使大家越來越關(guān)注如何通過測評提升高中培養(yǎng)質(zhì)量。目前,各考試科目依據(jù)不同的定位,兼顧知識學(xué)習(xí)與能力提升,輔之以系統(tǒng)的學(xué)業(yè)評價標(biāo)準(zhǔn),從內(nèi)容和能力兩個維度,通過相應(yīng)的各分項指標(biāo)形式得以呈現(xiàn)。因此當(dāng)學(xué)生完成考試以后,他所獲得的反饋還包括根據(jù)評價維度所描述的各分項指標(biāo)以及對應(yīng)的得分情況,學(xué)生可以了解自己的學(xué)習(xí)情況以及在群體中的相對位置。對于各科目的高中學(xué)業(yè)水平考試,學(xué)生更可以通過合格性考試的成績報告,發(fā)現(xiàn)自己在科目學(xué)習(xí)上的長處與短處,以完善下一步的學(xué)習(xí),并爭取在等級性考試中取得好成績。我們通過上述方法所形成的學(xué)校和區(qū)域的成績報告,對改善學(xué)校的教育教學(xué)起到了促進作用。
考試數(shù)據(jù)表明,上海師范大學(xué)附屬中學(xué)閔行分校在思想政治科目合格性考試上的表現(xiàn)非常突出,他們的學(xué)生在內(nèi)容領(lǐng)域和能力目標(biāo)評價維度各分項指標(biāo)上的得分率每年都比前一年有進步。如果以2017年該科目平均成績的位次為基準(zhǔn),則2018年比2017年在全市提升了23名,2019年又比前一年提升了65名。閔行第三中學(xué),在思想政治、地理、化學(xué)、生命科學(xué)四門學(xué)業(yè)水平等級性考試科目上的進步也很顯著,各科目的整體成績排位三年來實現(xiàn)了兩位數(shù)的增長。閔行區(qū)很好地運用了學(xué)校和區(qū)域的成績報告信息,區(qū)教育學(xué)院通過集體分析反饋和分學(xué)科到學(xué)校指導(dǎo)相結(jié)合的辦法,對學(xué)校的學(xué)科教學(xué)進行了有效干預(yù),提升了學(xué)生的學(xué)習(xí)質(zhì)量。
測評的目標(biāo)指向是學(xué)習(xí)。在高考綜合改革之前,測評的功能是以科目總分的方式實現(xiàn)學(xué)生學(xué)業(yè)的評價與篩選;在新高考的推動下,測評還能夠依據(jù)所建立的學(xué)業(yè)評價體系給予多維度多指標(biāo)的分析評價,實現(xiàn)對教與學(xué)的正向反撥;未來還可通過更多分析工具、更多分析視角探索測評與教和學(xué)的深度融合,即把測評貫穿于學(xué)習(xí)過程中或者教學(xué)過程中,更有效地促進學(xué)習(xí)、促進學(xué)習(xí)質(zhì)量的提高。
從不同維度分析測評大數(shù)據(jù)
在前期的工作基礎(chǔ)上,我們嘗試不同的分析方法與工具,對考試數(shù)據(jù)進行分析和挖掘,并反饋所獲得的有用信息,以促進學(xué)校教學(xué)質(zhì)量的提高。我們采用統(tǒng)計中的聚類方法進行評價維度的綜合聚類,結(jié)果發(fā)現(xiàn),對于學(xué)校來說,不同學(xué)科從不同維度來分析,可以得出不同的評價結(jié)果,而且對于不同的學(xué)校都有不同的需要提升之處。
僅以2019年數(shù)學(xué)科目高考學(xué)生的成績來分析各高中的數(shù)學(xué)教學(xué)情況。數(shù)學(xué)科目按照內(nèi)容領(lǐng)域和能力目標(biāo)兩個維度進行評價設(shè)計的,150分的試卷試題中——分屬內(nèi)容領(lǐng)域維度的四個分項指標(biāo):方程與代數(shù)(占40分)、函數(shù)與分析(占43分)、數(shù)運算數(shù)據(jù)整理和概率統(tǒng)計(占13分)、圖形與幾何(占54分);分屬能力目標(biāo)維度的五個分項指標(biāo):數(shù)學(xué)基礎(chǔ)知識與基本技能(占61分)、邏輯推理能力(占19分)、運算能力(占19分)、空間想象能力(占19分)、數(shù)學(xué)應(yīng)用與探究能力(占32分)。
為保證分析結(jié)果的統(tǒng)計意義,我們確定204所高中學(xué)校的39000多名學(xué)生為分析對象,他們參加了2019年本市的高考數(shù)學(xué)科目考試且得分都位列前95%,并且每所學(xué)校的實際考生人數(shù)都大于或等于50。
我們以學(xué)校為單位,分析各學(xué)校的每位學(xué)生在各評價維度相應(yīng)分項指標(biāo)上的得分率,尋求他們的共性,以呈現(xiàn)不同學(xué)校的類型和特點,希望能為學(xué)校的教學(xué)提供參考。
根據(jù)計算,204所高中學(xué)校從內(nèi)容領(lǐng)域維度得分上被分為了五類。這五類所含學(xué)校數(shù)目不等,分別是26所,49所,59所,41所和29所。
僅以其中兩類為例,我們可以發(fā)現(xiàn),包括上海中學(xué)等人們通常所說的“四校八校”在內(nèi)的29所學(xué)校被歸為一類,這些學(xué)校都是近年來表現(xiàn)突出的優(yōu)質(zhì)高中學(xué)校。包括天山中學(xué)、復(fù)旦中學(xué)等在內(nèi)的49所中學(xué)被歸為另一類,也都是公認的好學(xué)校。
從內(nèi)容維度來分析,可以得出的結(jié)論是——學(xué)生在試卷上的得分可以反映出這些學(xué)校的教師在數(shù)學(xué)科目內(nèi)容知識的教學(xué)是成功的。
但是,如果對能力目標(biāo)維度也進行了綜合聚類分析,同樣將學(xué)校分為五類,卻發(fā)現(xiàn)上述29所學(xué)校中有10所學(xué)校形成了單獨的一類,無疑,單單根據(jù)這一年的數(shù)據(jù)來看,這10所學(xué)校是兩個維度下綜合聚類分析表明最好的一類學(xué)校。
上述29所學(xué)校中的其他19所學(xué)校與49所學(xué)校中的22所組成了能力目標(biāo)維度綜合聚類分析結(jié)果中的單獨一類,這意味著這些學(xué)校的學(xué)生在高考答題時,在這一維度上有相似性。
雖然不同的分類方法會給出不同的結(jié)果,但是通過多元的觀察視角,結(jié)合具體維度的分項指標(biāo),就不難發(fā)現(xiàn)教與學(xué)改善的空間。
鄭方賢
