圣陶教育|張民選:基礎(chǔ)教育評價(jià)改革的六大趨勢
作者:江蘇圣陶教育科技發(fā)展有限公司 發(fā)布日期:2023-02-16
2020年,國務(wù)院印發(fā)的《深化新時(shí)代教育評價(jià)改革總體方案》明確提出,到2035年,基本形成富有時(shí)代特征、彰顯中國特色、體現(xiàn)世界水平的教育評價(jià)體系。黨的二十大報(bào)告也強(qiáng)調(diào),“完善學(xué)校治理和教育評價(jià)體系”。
在評價(jià)改革過程中,遇到“改革高原”的時(shí)候,怎么辦?有一個(gè)思路是,堅(jiān)持“教育要面向現(xiàn)代化、面向世界、面向未來”,“堅(jiān)持對外開放的基本國策”,堅(jiān)持“高水平對外開放”,“拓展世界眼光,深刻洞察人類發(fā)展進(jìn)步的潮流……以海納百川的寬闊胸襟,借鑒吸收人類一切優(yōu)秀文明成果”,在此基礎(chǔ)上形成中國式現(xiàn)代化,實(shí)現(xiàn)中華民族偉大復(fù)興,推動(dòng)建設(shè)更加美好的世界。
在這樣的思想指引下,我研究了全球關(guān)于基礎(chǔ)教育評價(jià)的前沿研究,包括來自聯(lián)合國、世界銀行、經(jīng)濟(jì)合作發(fā)展組織以及歐盟、東盟等發(fā)達(dá)國家的文獻(xiàn)報(bào)告。
這些報(bào)告呈現(xiàn)了基礎(chǔ)教育評價(jià)改革的六大趨勢,我們可以從中汲取營養(yǎng),以促進(jìn)中國式教育評價(jià)體系的建立,牽引基礎(chǔ)教育的高質(zhì)量發(fā)展。
轉(zhuǎn)變?yōu)槌掷m(xù)性、綜合性的監(jiān)測過去,我們對學(xué)生、教師和學(xué)校的評價(jià),往往是單項(xiàng)評價(jià)?,F(xiàn)在,迎來了大的轉(zhuǎn)向。轉(zhuǎn)向的標(biāo)志性成果是,2002年聯(lián)合國教科文組織開始聘請第三方監(jiān)測各國教育發(fā)展概況,每年發(fā)布監(jiān)測評價(jià)報(bào)告。而且,檢測與評價(jià)不是分開的兩個(gè)詞,而是合成的一個(gè)新詞叫M&E(monitor & evaluation)。評價(jià)具有滯后性,總是事后去檢查。但對教育來說,滯后性往往是致命的。生命只有一次,滯后不僅意味著浪費(fèi)金錢和人力,也可能導(dǎo)致浪費(fèi)孩子們的生命;對國家和社會來說,也可能導(dǎo)致浪費(fèi)潛在的人才。比如,一個(gè)玩沙子的孩子組織能力很強(qiáng),將來可能當(dāng)將軍,結(jié)果老師說孩子太皮了,也許就抹殺了孩子的天性,未來也少了一位將軍。因此,人們開始考慮另外一種方向。那么,什么是監(jiān)測呢?有學(xué)者在2001年指出,監(jiān)測是一種具有內(nèi)在動(dòng)機(jī)且精心設(shè)計(jì)的評價(jià)活動(dòng),旨在對一個(gè)項(xiàng)目持續(xù)提供多側(cè)面的信息反饋,從而發(fā)現(xiàn)實(shí)施過程中的問題和實(shí)施的效率效益。什么又是教育監(jiān)測?它是一種教育評估,但監(jiān)測的是教育事業(yè)或教育項(xiàng)目,在其實(shí)施過程中進(jìn)行。它通過在第一時(shí)間向決策者和實(shí)施者提供早期、具體、多維的操作和信息,不斷修正偏差,以完善教育目標(biāo)與方案、調(diào)整過程與配置、選擇適恰的教學(xué)方法技術(shù),從而確保既定教育目標(biāo)的實(shí)現(xiàn)。我覺得,這是教育評價(jià)應(yīng)該有的方向。正因如此,聯(lián)合國教科文組織從2002年起,每年既有總體性的評價(jià),又有重點(diǎn)項(xiàng)的監(jiān)測內(nèi)容。比如2003年,基于數(shù)字化盛行的時(shí)代背景,將“數(shù)字化轉(zhuǎn)型監(jiān)測”定為報(bào)告主題,并監(jiān)測各個(gè)國家的實(shí)施情況。OECD的PISA三年一次,可以監(jiān)測每個(gè)國家在完成義務(wù)教育階段時(shí)的學(xué)生發(fā)展水平和政策導(dǎo)向。英國教育質(zhì)量標(biāo)準(zhǔn)局對學(xué)校的評估和監(jiān)測,分為“優(yōu)秀、比較好、一般、需改進(jìn)”四個(gè)層次。越優(yōu)秀的學(xué)校,監(jiān)測的間隔時(shí)間越長,可能四年到校監(jiān)測一次,每年學(xué)校僅提供自評報(bào)告給質(zhì)量標(biāo)準(zhǔn)局;有問題、需改善的學(xué)校,則每年參與兩次評審,不斷監(jiān)控學(xué)校發(fā)展過程。因?yàn)樯虾⒓恿薖ISA,同時(shí)結(jié)合本地需求,我們設(shè)計(jì)了《上海市義務(wù)教育階段學(xué)生學(xué)業(yè)質(zhì)量綠色指標(biāo)體系》。評估每兩三年舉行一次,包含學(xué)業(yè)成績、學(xué)習(xí)動(dòng)力、學(xué)生負(fù)擔(dān)、教學(xué)方式、體質(zhì)健康、師生關(guān)系等。下圖是一所學(xué)校2014年和2015年的兩次評估結(jié)果,呈現(xiàn)了10個(gè)向度的指數(shù)情況。評估結(jié)果反饋給校長,就能幫助學(xué)校不斷調(diào)整發(fā)展方向,越辦越好。2018年,我們對方案進(jìn)行了修改,讓評估更完善。轉(zhuǎn)向同時(shí)關(guān)注對地方政府的評價(jià)我們當(dāng)然希望一個(gè)好校長帶出一所好學(xué)校,但公立教育,特別是義務(wù)教育的均衡與質(zhì)量水平,不但有賴于教師和校長,更取決于地方政府的教育政策、經(jīng)費(fèi)資源、人力資源和生源配置。OECD的PISA測評中,上海成績第一。成績背后,與學(xué)生認(rèn)知發(fā)展、投入方法、投入多少有關(guān),也與學(xué)校差異有關(guān)。那么,學(xué)校間的差異由什么造成?學(xué)校內(nèi)部哪些是更重要的因素?高水平家庭的孩子進(jìn)了好學(xué)校,農(nóng)民工子女進(jìn)了差的學(xué)校,原因是什么……于是,政策和資源配置的問題就出來了。綜合來看,政府的四大配置決定了學(xué)校發(fā)展水平——- 管理資源配置:包括校長配備、財(cái)政經(jīng)費(fèi)、自主空間,比如,財(cái)政經(jīng)費(fèi)好的學(xué)??赡茏杂蓹?quán)大,差一點(diǎn)的學(xué)校反而錢不足;
- 物質(zhì)資源配置:包括校舍場地、信息資源、實(shí)驗(yàn)設(shè)施;
- 環(huán)境資源配置:包括學(xué)生來源、專業(yè)合作、社會支持,比如優(yōu)秀學(xué)??梢匀≌猩胀▽W(xué)??赡苤辉诒窘值勒猩?;
- 人力資源配置:包括師生比例、優(yōu)秀師資、進(jìn)修機(jī)會。
沒有種種資源,一個(gè)好校長有時(shí)候也辦不了一所好學(xué)校。所以,教育評價(jià)包含對政府的督導(dǎo),是好的轉(zhuǎn)向。聯(lián)合國教科文組織2017和2018全球教育監(jiān)測報(bào)告的主題是“教育問責(zé)”,指向“政府到底怎么做”。中國的《評價(jià)改革方案》也強(qiáng)調(diào)“各級黨委和政府要堅(jiān)持正確政績觀”,符合國際趨勢;同時(shí),以學(xué)生評價(jià)、政府評價(jià)、學(xué)校評價(jià)、用人評價(jià)、教師評價(jià)構(gòu)成系統(tǒng),與OECD的評價(jià)系統(tǒng)完全一樣。可見,我們已經(jīng)走到世界的前列。但是,實(shí)際辦學(xué)過程當(dāng)中,我們還是可以看到學(xué)校間的差異。關(guān)于學(xué)校差異對學(xué)生成績的影響力水平,OECD統(tǒng)計(jì)顯示,學(xué)校與學(xué)生數(shù)學(xué)成績之間的方差占比平均值是37%。芬蘭的學(xué)校高度均衡,只有8%;上海的初中是29%,高中是58%,折算后上海整體變成47%,差異驚人。過去幾年上海為什么堅(jiān)持“均衡優(yōu)質(zhì)”,原因就在這里。到“為教師的評價(jià)”和“教師自己的評價(jià)”在教育評價(jià)中,對教師的評價(jià)起步較晚。美國從1957年開始做教師評價(jià),由于當(dāng)時(shí)主要評價(jià)是課程評價(jià),但直到80年代評價(jià)工作仍未完成,教育質(zhì)量仍然不好。于是,美國開始把教師單拎出來進(jìn)行評價(jià),但那時(shí)主要是問責(zé)式評價(jià),“看看老師在哪些地方還沒做好,以提高教育質(zhì)量”。因此,目前對教師的評價(jià),是以行政管理的方式推進(jìn),按照績效獎(jiǎng)懲教師,對教師教育質(zhì)量的推動(dòng)作用非常有限。學(xué)者們認(rèn)為,教師評價(jià)更應(yīng)該轉(zhuǎn)變?yōu)椤盀榱私處煂I(yè)發(fā)展的評價(jià)”,因?yàn)榻處煂I(yè)水平提升,教育質(zhì)量就會隨之而提升。此外,沒有兩個(gè)教育情景完全相同,忽視了教師個(gè)體差異而進(jìn)行評價(jià),一定會引起內(nèi)卷,讓老師身心疲勞;反過來,“躺平”也會降低教師的幸福感。以教師為對象,檢驗(yàn)他們的履職程度當(dāng)然很重要。它本質(zhì)上是一個(gè)由外向內(nèi)的問責(zé),包含遵紀(jì)守法、履約敬業(yè)、達(dá)成目標(biāo)、檢驗(yàn)績效高低等方面,以此獎(jiǎng)優(yōu)懲懶,提升教師效率。但是,它容易進(jìn)入精致主義層面,而且是無意義的精致。當(dāng)然,對教師的評價(jià)還要兼顧多層次、多工具的評價(jià),其核心是保障公平。但它的弱點(diǎn)是有“反駁效應(yīng)”。比如設(shè)立“五唯”指標(biāo),那就可能出現(xiàn)只圍繞指標(biāo)做事而忽略其他事項(xiàng)的情況,同樣會影響孩子的健康成長。本來目的是監(jiān)測,結(jié)果變成“你評什么我就干什么”。久而久之,它會產(chǎn)生競爭內(nèi)卷和躺平。因此,要追求“去反駁效應(yīng)”。促進(jìn)教師專業(yè)發(fā)展的評價(jià),則是一種協(xié)作互信、講究反饋和改進(jìn)、內(nèi)外結(jié)合的專業(yè)指導(dǎo)。它重視教師的發(fā)展過程,重視發(fā)現(xiàn)教師間的差異,并據(jù)此完善教師的行動(dòng),提供反饋建議。這種評價(jià)的條件是要看輕利害,不以獎(jiǎng)懲為主,力求真實(shí),分析教師的行為,進(jìn)行建議指導(dǎo)。所謂教師自己的評價(jià),強(qiáng)調(diào)內(nèi)在主體需求的升華。教師愿意自己測評,愿意參與評價(jià)的設(shè)定,進(jìn)行反思研究,凸顯教師自己的專業(yè)特色,提升能力。這種評價(jià)的條件是提供參照,提供最佳案例,以及通過技術(shù)支持進(jìn)行自診自評,發(fā)現(xiàn)優(yōu)勢弱點(diǎn),提高自我效能。上海奉賢中學(xué),在教師評價(jià)中專門設(shè)立了“教師自設(shè)性挑戰(zhàn)項(xiàng)目評估”。教師自己提出來明年想做的兩件事,個(gè)人申報(bào),立項(xiàng)審核,過程中學(xué)校給予指導(dǎo),最后總結(jié)評價(jià),實(shí)現(xiàn)了教師自主立項(xiàng)、學(xué)校評估。上海一師附小搭建“教師發(fā)展評價(jià)系統(tǒng)”,讓教師個(gè)人和集體都明白:自己在哪里(起點(diǎn));可以到哪里去(方向);如何達(dá)到(措施);如何知曉有沒有到達(dá)(評價(jià))。由此,形成了這樣的教師成長框架:我現(xiàn)在的狀況是什么?(自我分析、自我定位)→ 我努力的方向(鎖定目標(biāo)、細(xì)化步驟)→我采取的措施(投入研修、學(xué)習(xí)實(shí)踐)→ 我的目標(biāo)達(dá)成(互評總結(jié)、持續(xù)發(fā)展)。這一過程可以通過自我評價(jià)、合作評價(jià)、發(fā)展評價(jià)來推動(dòng)實(shí)施。上海閔行實(shí)驗(yàn)小學(xué)將“基礎(chǔ)性評價(jià)”和“發(fā)展性評價(jià)”并舉(70%-30%),努力保障教師有自己選擇的權(quán)利和發(fā)展空間。學(xué)校在設(shè)計(jì)評價(jià)方案時(shí)適度“留白”,邀請教師參與、鼓勵(lì)教師首創(chuàng);建立個(gè)性發(fā)展平臺,提供專業(yè)成長的選擇性路徑;激活教師的內(nèi)在發(fā)展自覺,揚(yáng)其長、成其能,讓每個(gè)人的優(yōu)勢真正表現(xiàn)出來。轉(zhuǎn)向“基礎(chǔ)知識”與“核心素養(yǎng)”并舉以PISA為例,上海從2009年開始一直領(lǐng)先于全世界,大家都覺得上海是最好的了,其實(shí)不然。將所學(xué)的基礎(chǔ)學(xué)科知識和技能運(yùn)用到不同場景中去,主要是基礎(chǔ)素養(yǎng)。而完整的素養(yǎng)框架,還包含計(jì)算機(jī)問題解決、財(cái)經(jīng)素養(yǎng)、協(xié)作問題解決、全球勝任力、創(chuàng)新能力,這些才是核心素養(yǎng)勝任力。在這些勝任力中,我們一個(gè)第一也沒有。在PISA2012以計(jì)算機(jī)為工具進(jìn)行的一項(xiàng)學(xué)生評價(jià)中,中國的成績是全世界第六(536分),看上去還不錯(cuò)。但當(dāng)我假設(shè)“閱讀、數(shù)學(xué)、科學(xué)知識學(xué)習(xí)越好,成績越高,就越能夠解決問題”這樣一個(gè)命題,重新排名,上海就墊底了。可以看到,韓國(561分)、美國(508分)、新加坡(562分)等地分?jǐn)?shù)是正相關(guān)的,即“閱讀、數(shù)學(xué)、科學(xué)學(xué)得越好,解決問題的能力也越強(qiáng)”,但中國是負(fù)相關(guān)的,而且是全世界最厲害的。我們原來閱讀、數(shù)學(xué)、科學(xué)是全世界第一,但是負(fù)相關(guān)50分,問題解決的能力就排到18位了,真的成了“高分低能”。問題在哪?PISA描述得很清楚——對老師培養(yǎng)學(xué)生解決問題的能力沒有進(jìn)行深入研究。什么叫提升學(xué)生解決問題的能力?首先,學(xué)生有沒有意愿參與這樣的認(rèn)知過程,是不是有利于學(xué)生個(gè)人潛能的發(fā)揮?問題有沒有不同的情景?問題解決過程是什么樣的?配置與解決過程應(yīng)該有哪些思維能力?……這些問題不搞清楚,怎么能提高學(xué)生解決問題的能力?我們目前的問題就在這里。教學(xué)評價(jià)仍是核心,走向多維評價(jià)教學(xué)仍是重要的評價(jià)方式,而且評價(jià)維度在不斷精細(xì)化。原來我們只講教學(xué),但其實(shí)教學(xué)可以分成課堂管理、教學(xué)質(zhì)量和情感支持三個(gè)維度。我們參加了一項(xiàng)全球性的教學(xué)視頻研究,每個(gè)國家85位數(shù)學(xué)教師,每人上兩堂課(“一元二次方程”),錄制上課教學(xué)行為的視頻,進(jìn)行同課異構(gòu),觀察其中差異。下圖是對比情況。可以看到,我們的課堂管理(圖中灰色線段)是最強(qiáng)的,教師管理很厲害,高于日本、英國、德國三個(gè)典型國家。但是,我們的教學(xué)質(zhì)量(圖中藍(lán)色線條)就差了,相當(dāng)集中但是水平較低,在及格左右。看來,這么多國家都在搞教學(xué)改革,課堂卻還是比較傳統(tǒng)。在社情支持(圖中灰色虛線)中,我們也較差。進(jìn)一步細(xì)看,教學(xué)可以分成學(xué)科內(nèi)容質(zhì)量、學(xué)生認(rèn)知參與、基于學(xué)生理解的評價(jià)與回應(yīng)、課堂對話。我們只有教師的學(xué)科知識掌握第一,學(xué)生認(rèn)知參與跌下來了,理解學(xué)生方面稍微好點(diǎn),課堂對話較差。這些教學(xué)行為本身值得我們思考。上圖是關(guān)于教學(xué)的情感支持,圖中越向右偏,說明對學(xué)生的支持越大。8個(gè)國家和地區(qū)中,情感支持我們最差。分析視頻發(fā)現(xiàn),我們的課堂里,教師經(jīng)常問大家“懂了沒有”??傻聡處煆膩聿粏枴岸藳]有”,而是經(jīng)常問“哪幾位不懂”。學(xué)生回答“我不懂”,這時(shí)就是教學(xué)中的情感支持。所有的學(xué)生都愿意,也敢于在課堂上說“我不懂”。但是,我們的學(xué)生不敢說、不輕易說。
細(xì)分下來,對學(xué)生的情感支持又可分四個(gè)指標(biāo),我們的指標(biāo)大部分都處于中間層次,有支持但不強(qiáng)烈。最后一個(gè)趨勢是運(yùn)用信息技術(shù),它正在成為一個(gè)新的杠桿。首先,大家都把信息技術(shù)作為老師應(yīng)該掌握的內(nèi)容,但這方面我們不占優(yōu)勢。疫情之下,我們通過遠(yuǎn)程教育,通過信息化,解決了所有同學(xué)不失學(xué)的情況。但是,數(shù)字化更應(yīng)該是對每個(gè)學(xué)生因材施教,這個(gè)方面我們做得還不夠好。目前,世界各國已經(jīng)在向著上圖的方向發(fā)展,即學(xué)生有助學(xué)系統(tǒng),教師有助教系統(tǒng),這些系統(tǒng)都在大數(shù)據(jù)支持下不斷反饋。2021年,歐盟在“數(shù)字能力框架指南”的基礎(chǔ)上,研發(fā)了一套名為SELFIE的數(shù)字教育自我評價(jià)工具(分學(xué)校、職教、教師和學(xué)前版),可以供學(xué)校、教師和學(xué)生自測自評使用。其中,對老師的評價(jià)分成“專業(yè)投入(9)、數(shù)字資源使用(5)、教與學(xué)(5)、學(xué)生測評(3)、賦能學(xué)習(xí)者(4)、提升學(xué)生數(shù)字素養(yǎng)(6)”等六個(gè)方面(括號中數(shù)字為指標(biāo)數(shù)量),共設(shè)32項(xiàng)測評指標(biāo),每個(gè)指標(biāo)又分成1~6的熟練水平。比如,數(shù)字資源使用1指標(biāo),包含6個(gè)熟練度:水平1—我意識到;水平2—我試用過;水平3—我已使用;水平4—我可以在豐富的工具中挑選使用;水平5—我反思并重新設(shè)計(jì)與改進(jìn)給孩子的東西;水平6—我可以自創(chuàng)并自設(shè)。借助現(xiàn)代信息技術(shù)和數(shù)據(jù)分析,歐盟不僅給老師進(jìn)行測評,還可以基于幾十萬教師數(shù)據(jù)提供指導(dǎo):哪些方面你更強(qiáng),哪些方面你還弱;并且給出提升的建議,幫助教師成長。
【版權(quán)聲明】文章來源:新校長傳媒、中小學(xué)校長論壇微信公眾號;
內(nèi)容據(jù)作者在第二屆中國基礎(chǔ)教育論壇的報(bào)告整理。作者 | 張民選(聯(lián)合國教科文組織教師教育研究中心主任)。版權(quán)歸相關(guān)權(quán)利人所有,轉(zhuǎn)載此文是出于傳遞更多信息之目的。尊重原創(chuàng),如涉版權(quán),請聯(lián)系刪除。