什麼要忽略理解你孩子的考試成績

現在,學校的第一個月結束了,父母可以為學年的下一個里程碑做好準備 - 他們很快就能得到他們的孩子去年所做的州考試報告。

我的估計顯示,去年公立學校大約有 26 萬學生參加了全州範圍的閱讀和數學考試。 他們中的許多人還參加了全州範圍的科學考試。 這些測試為家長提供了有關孩子在學校表現的重要信息。

然而,我的研究還表明,當父母收到孩子的考試成績報告時,他們可能很難將重要信息與統計胡言亂語區分開來。

更重要的是,結果甚至可能無法為他們提供有關孩子學業成長的準確信息。

您的孩子“熟練”了嗎?

2002 年頒布的《不讓一個孩子掉隊》法要求所有州為三至八年級以及高中一年級(通常是十年級或十一年級)制定閱讀和數學的“成績水平標準”。 各州還被要求開發測試來衡量學生的水平 “熟練程度” 在每次測試中。


內在自我訂閱圖形


2015 年 XNUMX 月通過的新聯邦法律 每個學生成功法案(ESSA),將繼續這種做法。

因此,家長收到的測試報告會將孩子分為“基礎”或“熟練”等成績級別。 每個州都決定這些分類的名稱,但至少有一個類別必須表示“熟練”。

這些成績級別類別在測試成績報告中進行了描述,因此家長很容易理解這些信息。 例如,我發現每年查看我的兒子是否在每個學科領域都達到熟練程度很有幫助。

但在某些州,兒童在某一年的考試成績及其成績水平並不是報告的唯一信息。 一個新的統計指數,稱為“學生成長百分位數” 正在進入報告 被送到11個州的父母家中。 二十七個州也使用該指數來評估教師。

儘管衡量學生的“成長”或進步聽起來是個好主意,但學生成長百分位數尚未得到研究的支持。 實際上 幾項研究表明 他們 不提供準確的描述 學生的進步和教師的效率。

這是什麼意思?

“學生成長百分位”到底是什麼?

它們是 2008 年提出的指數 達米安·W·貝特本納一位統計學家建議將它們用作描述性指標 學生的“學業成長” 從一個學年到下一個學年。 這個想法是為了描述學生與同齡人相比的進步。

就像兒科醫生用來描述兒童身高和體重的生長圖表一樣,學生生長百分位數的範圍從最低的99 到最高的XNUMX。然而,他們的計算比身高和體重等物理測量存在更多的誤差。 我們在馬薩諸塞大學阿默斯特分校的研究表明 重大錯誤 在他們的計算中。

學生成長百分位數是根據考試成績得出的,這並不能完全準確地描述學生的學術能力:考試成績受到許多因素的影響,例如特定日期提出的問題、學生的氣質、參加考試時的參與程度等。測試或只是用於對答案進行評分的方法。

每個學生的成長百分位是使用至少兩個不同的測試分數計算的,通常相隔一年或更長時間。 然後將學生最近的考試成績與前幾年成績相似的學生的最新考試成績進行比較。 這是為了看看今年哪些學生的分數更高或更低。

然而,問題在於每次計算都會帶來一些測量誤差。 進一步的計算只會加劇該錯誤。 如此之多以至於結果最終出現兩倍的錯誤。 沒有統計複雜性 可以消除這個錯誤。

問題是,為什麼這麼多國家採用如此不可靠的措施?

用它來問責

使用學生成長百分位數的部分原因是希望了解學生在特定年份學到了多少知識,並將這種進步與教師評估等問責制度聯繫起來。

在2010, 爭先恐後的撥款競賽 邀請各州提出利用考試成績評估教師的創新方法,這為這一新的“增長”衡量標准在許多州迅速應用鋪平了道路。

然而,在對其準確性進行研究之前就開始使用學生成長百分位數。 直到現在才有足夠的研究機構來評估它們,並且所有研究都得出相同的結論——它們包含很多錯誤。

除了我們在馬薩諸塞大學阿默斯特分校的研究之外,教育非營利組織還進行了關於學生成長百分位數準確性的研究,例如 西埃德, 教育考試服務 other 研究機構。 研究人員 JR洛克伍德凱瑟琳·E·卡斯特拉諾 最近結束 “大量研究基礎已經指出,對個別學生的學生成長百分位數估計存在很大誤差。”

然而,許多州似乎並沒有意識到這些研究結果。 馬薩諸塞州甚至走得更遠 按生長百分位數對兒童進行分類 低於 40 的兒童為“較低生長”,生長百分位數大於 60 的兒童為“較高生長”。

衡量教師表現

正如我之前提到的,27 個州使用學生成長百分位數將教師分為“有效”或“無效”。 為此目的使用增長百分位的研究表明他們可以 低估表現 最有效率的教師,以及 高估績效 效率最低的教師——這與這些州試圖對其教師評估系統所做的事情恰恰相反。

WestEd 最近的一份報告評估了使用學生成長百分位數來評估教師和 總結 他們“沒有達到此類高風險決策所需的穩定性”。

讓我們回到傳統措施

我相信學生成長百分位讓我們在使用教育測試來改善學生學習方面倒退了一步。

兒童在教育測試中的表現的傳統衡量標準,例如他們在特定年份是否“熟練”以及他們的實際測試分數,可以很好地了解他們在特定年份的數學或閱讀表現。

這些傳統的百分位排名仍然在許多教育測試中報告,就像我們作為父母在學校時一樣。 傳統的百分位數排名將我們與特定年份的國家或州群體進行比較,而不是將我們與國家或州的其他孩子在不同年份參加的不同測試中的“成長”進行比較,就像學生成長百分位數試圖做的那樣。

鑑於我們現在對學生成長百分位數的了解,我對家長的建議不僅是在孩子的考試成績報告中忽略它們,而且還應該聯繫他們所在州的教育部門,詢問他們為什麼報告如此不可靠的統計數據。

制定衡量學生在一年內學到了多少知識的措施是一個很好的目標。 不幸的是,學生成長百分位數並不能很好地衡量這一點。

關於作者

Stephen Sireci,教育政策教授, 馬薩諸塞州阿姆赫斯特大學

這篇文章最初發表於 談話。 閱讀 原創文章.

相關書籍:

at InnerSelf 市場和亞馬遜