如何避免統計誤解的七大罪

統計數據是理解我們周圍世界模式的有用工具。 但是,在解釋這些模式時,我們的直覺經常讓我們失望。 在本系列中,我們將討論一些常見的錯誤,以及在考慮統計數據,概率和風險時如何避免這些錯誤。談話

1。 假設小的差異是有意義的

股票市場的許多日常波動代表機會,而不是任何有意義的東西。 當一方領先一兩點時民意調查的差異往往只是統計噪音。

您可以通過要求查看與數字相關的“誤差範圍”來避免得出關於這種波動的原因的錯誤結論。

如果差異小於誤差範圍,則可能沒有有意義的差異,並且變化可能僅僅是隨機波動。

如何避免統計誤解的七大罪誤差條表示分數的不確定程度。 當這樣的誤差邊緣重疊時,差異可能是由統計噪聲引起的。


內在自我訂閱圖形



2。 將統計意義與現實意義等同起來

我們經常聽到關於兩個群體在某種程度上如何不同的概括,例如女性更加培養而男性身體更強壯。

這些差異往往牽涉到刻板印象和民間智慧,但往往忽略了兩組人之間的相似性,以及群體內人的變異。

如果你隨機選擇兩個男人,他們的體力可能會有很大差異。 如果你挑選一個男人和一個女人,他們最終可能在培養方面非常相似,或者男人可能比女人更有培養。

您可以通過詢問組之間差異的“效果大小”來避免此錯誤。 這是衡量一組平均值與另一組平均值之差的程度。

如果效果大小很小,那麼兩組非常相似。 即使效果大小很大,這兩組仍然可能會有很大的變化,因此並非一組的所有成員都與另一組的所有成員不同。


3。 忽視了極端

當你關注的事情遵循“效果”時,效果大小的另一面是相關的正態分佈“(有時稱為”鐘形曲線“)。 這是大多數人接近平均分數的地方,只有一小部分遠遠高於或低於平均水平。

當發生這種情況時,該組性能的微小變化會產生差異,這對於普通人來說沒有任何意義(參見2點),但這會極大地改變極端的特徵。

通過反思你是否處理極端事件來避免這個錯誤。 當您與普通人打交道時,小組差異通常無關緊要。 當你非常關心極端情況時,小群體差異可能很重要。

如何避免統計誤解的七大罪當兩個群體遵循正態分佈時,它們之間的差異在極端情況下將比在平均值中更明顯。


4。 相信巧合

你知道嗎? correlation 美國每年因墮入游泳池而被淹死的人數和尼古拉斯·凱奇出現的電影數量之間?

如何避免統計誤解的七大罪但是有因果關係嗎? tylervigen.com

如果你看起來足夠努力,你可以找到有趣的模式和相關性,這只是巧合。

僅僅因為兩件事情同時或以類似的模式發生變化,並不意味著它們是相關的。

通過詢問觀察到的關聯有多可靠來避免此錯誤。 它是一次性的,還是多次發生的? 可以預測未來的協會嗎? 如果你只看過一次,那很可能是偶然的機會。


5。 向後導致因果關係

當兩件事情相關時 - 比如失業和心理健康問題 - 可能很容易看到“明顯的”因果路徑 - 比如心理健康問題會導致失業。

但有時候因果路徑會走向另一個方向,例如導致心理健康問題的失業。

您可以通過記住在查看關聯時考慮反向因果關係來避免此錯誤。 影響能否朝另一個方向發展? 或者它可以雙向進行,創建反饋循環?


6。 忘記考慮外部原因

人們經常無法評估可能在兩件事之間產生關聯的可能的“第三因素”或外部因素,因為兩者實際上都是第三因素的結果。

例如,在餐館吃飯和改善心血管健康之間可能存在關聯。 這可能會讓你相信兩者之間存在因果關係。

然而,可能會發現那些經常在餐館吃飯的人處於社會經濟的高位,並且還可以提供更好的醫療保健,並且提供更好的心血管健康的醫療保健。

通過記住在看到相關性時考慮第三個因素,可以避免此錯誤。 如果你跟進一件事是可能的原因,那麼問問自己反過來會導致什麼? 第三個因素是否會導致觀察到的結果?


7。 欺騙性的圖表

在圖表上的垂直軸的縮放和標記中發生了許多惡作劇。 標籤應顯示您正在查看的任何內容的完整有意義範圍。

但有時候圖形製作者會選擇較窄的範圍來製作一個小的差異,或者協會看起來更有影響力。 在從0到100的範圍內,兩列可能看起來相同。 但是,如果您繪製僅顯示從52.5到56.5的相同數據,它們可能看起來截然不同。

您可以通過注意軸上的圖形標籤來避免此錯誤。 特別懷疑未標記的圖表。

如何避免統計誤解的七大罪圖表可以講述一個故事 - 根據比例,差異看起來更大或更小。

關於作者

Winnifred Louis,社會心理學副教授, 昆士蘭大學 和Cassandra Chapman,社會心理學博士候選人, 昆士蘭大學

這篇文章最初發表於 談話。 閱讀 原創文章.

相關書籍:

at InnerSelf 市場和亞馬遜