學生的考試成績告訴我們他們生活的社區比他們所知道的更多

每年,美國各地的政策制定者都會根據標準化測試的結果做出改變生活的決定。 這些高風險的決定包括但不限於學生晉升到下一年級,學生參加高級課程的資格,高中畢業的資格和教師任期。 在40州, 教師進行評估 部分基於學生標準化考試的結果,幾乎是30州的學校管理者。

然而,研究表明,標準化測試的結果並不像他們所希望的那樣反映教學質量。 我和同事都在進行過研究 新澤西州, 康涅狄格, 馬薩諸塞, 愛荷華州密歇根州.

結果表明,可以預測在一些標準化測試中將獲得熟練或以上成績的學生的百分比。 我們可以通過查看社區的一些重要特徵來做到這一點,而不是與學校本身相關的因素,如學生 - 教師比例或教師質量。

這就增加了教育問責制度中存在嚴重缺陷的可能性,以及教育者和學生在這些制度中做出的決定。

標準化測試

自喬治·W·布什總統簽署以來,學生在強制性標準化考試中的分數被用於評估美國教育工作者,學生和學校 有教無類法案 (NCLB)在2002中。

雖然已有超過20州已經在1990後期對某些年級進行了州級測試,但NCLB要求所有50州的年度標準化測試。 它需要三到八年級和高中一次的標準化數學和英語語言藝術測試。 國家教育官員還必須在四年級,八年級和高中一次管理標準化科學考試。


內在自我訂閱圖形


奧巴馬政府通過Race to the Top補助計劃的要求擴大了標準化測試,並通過資助開發兩個與之相關的國家標準化測試 共同核心國家標準:智慧平衡評估聯盟(SBAC)和 評估大學和職業準備的伙伴關係 (PARCC)。

45個州最初以某種形式採用共同核心。 大約20目前是PARCC或SBAC聯盟的一部分。 Race to the Top應用程序所需的關鍵部分使用學生測試結果來評估教師和校長。

預測分數

It's 已經很成熟了 校外,社區人口統計和家庭層面的變量會嚴重影響學生在大規模標準化考試中取得的成績。

例如, 家庭收入中位數 是SAT結果的強有力預測指標。 與國家標準化測試成績密切相關的其他因素包括父母教育水平,學校社區單親家長的百分比以及社區貧困家庭的百分比。

我們決定看看我們是否可以根據與學生所在社區相關的人口統計學因素來預測標準化考試成績。 通過查看美國人口普查數據中的三到五個社區和家庭人口統計變量, 我們已經能夠準確預測 通過12獲得三年級標準化考試成績達到或高於此水平的學生的百分比。 這些預測是在不考慮學區數據因素(如學校規模,教師經驗或每個學生支出)的情況下進行的。

我們的模型可以識別特定變量對學生分數的影響程度。 這使我們能夠確定與測試結果相關的最重要的人口統計特徵。 例如,通過僅考慮一個特徵 - 生活在貧困中的特定社區中的家庭百分比 - 我們可以解釋八年級英語語言藝術中考試成績的幾乎58百分比。

我們最近的研究 在新澤西州300學校開設了六年級到八年級的三年考試成績。 我們研究了社區中每年收入超過200,000的家庭比例,社區中貧困人口的百分比以及擁有學士學位的社區中人口的百分比。 我們發現,我們可以預測在我們抽樣的學校中75百分比中獲得熟練或以上成績的學生百分比。

早期的一項研究 專注於新澤西州五年級考試成績的學生在三年內對84百分比的學校進行了準確預測。

更明智的評估

需要明確的是,這並不意味著金錢決定學生可以學到多少錢。 這不可能是事實。 事實上,我們的研究結果表明,標準化考試並不能真正衡量學生學習的數量,教師的教學水平,以及學校領導如何有效領導學校。 這些測試是非常容易測量校外因素的鈍器。

雖然標準化評估的一些支持者聲稱可以使用分數來衡量改進,但我們發現噪音太大了。 每年測試分數的變化可歸因於學年的正常增長,無論學生是否有糟糕的一天或感到生病或疲倦,計算機故障或其他無關因素。

根據標準化評估創建者發布的技術手冊,目前用於評判教師或學校管理者效率或學生成績的測試均未針對這些用途進行驗證。 例如,沒有一個PARCC研究,如 由PARCC提供,直接解決這些問題。 這些測試根本不是為診斷學習而設計的。 它們只是監控設備,其技術報告就是證明。

最重要的是:無論您是在嘗試衡量熟練程度還是增長,標準化測試都不是答案。

雖然我們在幾個州的結果令人信服,但我們需要在國家層面進行更多研究,以確定校外因素對考試成績的影響程度。

如果這些標準化的測試結果可以通過社區和家庭因素高度準確地預測,那麼它將具有重大的政策含義。 在我看來,它表明我們應該放棄使用這些測試結果的整個政策基礎來做出關於學校人員和學生的重要決定。 畢竟,這些因素超出了學生和學校人員的控制範圍。

雖然關於標準化測試結果的優點存在意識形態爭議,但科學已經變得更加清晰。 結果表明,標準化的測試結果更多地講述了學生所居住的社區,而不是學生學習的數量或學生在學年期間的學業,社交和情感成長。

雖然有些人可能不想接受它,但隨著時間的推移, 教師的評估 是比標準化測試更好的學生成績指標。 例如,基於課堂評估的高中GPA比大學一年級學生在大學第一年的成功預測更好。

談話與那些與教師關係不大的考試成績相比,這種變化對提供有效教學的重要信息有很大幫助。

關於作者

Christopher Tienken,教育領導管理與政策副教授, 西頓霍爾大學

這篇文章最初發表於 談話。 閱讀 原創文章.

本作者的書籍

at InnerSelf 市場和亞馬遜