超級預報員:大流行規劃人員可以從世界上最好的預報器中學到什麼英國首相鮑里斯·約翰遜(Boris Johnson)前首席顧問多米尼克·卡明斯(Dominic Cummings)表示,專家們錯誤地認為這是錯誤的。 卡明斯認為 英國政府在2020年XNUMX月提出的官方科學建議極大地誤解了這場流行病的蔓延方式,導致延緩了封鎖行動,造成數千人喪生。

根據卡明斯的說法,某些專家對流行病或醫學知識較少,例如數據科學家Ben Warner,人工智能研究員DeepMind的Demis Hassabis和數學家Tim Gowers,他們在這一點上給出了更準確的預測。

卡明斯也被稱為 風扇 of 超級預測 菲利普·泰特洛克 (Philip Tetlock) 著,這是一本關於人們比大多數人更可靠地預測未來事件的書。 一些超級預報員 被讚揚了 他們對大流行的預測,而其他人也 批評專家的 記錄。

那麼政府是否應該更多地使用超級預測器而不是依賴科學專家? 證據不是那麼明確。 但是,政府似乎肯定可以從超級預測中學到一些東西。

美國著名研究 在2014年發布的超級預報員上,他們是一支精英船員。 只有前2%的競爭者在地緣政治預測比賽中表現良好,無法贏得冠軍。 他們的任務是為數十個問題的可能答案分配概率。


內在自我訂閱圖形


研究人員提供了一些說明性​​的例子。 誰會是2012年的俄羅斯總統? 朝鮮會在未來三個月內引爆另一枚核武器嗎? 明年會有多少難民逃離敘利亞?

當然,僅僅因為某人一年做得好就不能證明他們比其他任何人都更加熟練。 也許他們只是走運了。 我們必須看看他們在接下來的幾年中做得如何,才能評估他們的真正“超級”水平。

令人印象深刻的是,隨著比賽進行了三年,這些超級預測者保持了自己的優勢。 實際上,在被合併為僅包含其他頂級績效人員的“超級預測團隊”之後,他們的績效有了實質性的提高。 研究人員還發現,與處於控制狀態的預報員相比,團隊合作和接受相關培訓可以提高其他預報員的績效。

團隊與訓練

無論我們是否接受卡明斯的話,即英國的大流行規劃都遭受了“經典的集體思維泡沫”,我們知道團隊並不總是做出明智的決定。 是什麼使這些團隊在美國研究中更加成功?

很難肯定地說,但是研究人員特別鼓勵團隊提出精確的問題,以鼓勵對支持特定預測的證據進行更清晰的思考,“尋找與您當前的預測相矛盾的證據”,並建設性地提出替代觀點。 .

這樣的辯論很可能 改善集體判斷力防止集體思維. 團隊成員也不需要達成共識。 儘管他們共享信息和意見,但是他們仍然做出了單獨的預測,並通過算法進行了組合。 特別是超級預報員團隊 高度敬業,經常與其他團隊成員共享信息並提出問題。

另一項研究 仔細研究了哪些特定的培訓技術似乎最有幫助。 三種技術尤其具有更高的準確性。 首先是所謂的比較類的使用。

例如,如果我要預測本尼迪克特·康伯巴奇(Benedict Cumberbatch)和索菲·亨特(Sophie Hunter)在五年內仍然在一起的可能性,那麼考慮其他相關的“階級”(例如名人婚姻的階級,甚至是婚姻的階級)可能會有幫助一般的婚姻。 這使我可以回顧歷史,以作出自己的預測:在任何給定的五年時間內,名人婚姻的終結率是多少?

第二個是利用可用的數學和統計模型來幫助表達自己的觀點。 第三是“選擇正確的問題” –建議花更多時間預測對您比其他人對該主題了解更多的問題,或者可能會進行更多研究的問題的答案。 然而,研究人員強調 培訓 可能在整體上為提高性能做出了貢獻。

研究還表明 當我們跟踪過去的表現時,準確性會提高 -但是反饋的類型很重要。 您認為 20% 的時間會發生的結果實際上有 20% 的時間會發生嗎? 您認為90%的時間會發生什麼結果呢? 對於那些接收此類信息的人,性能會有所提高。

政府可以做得更好嗎?

英國政府是否可以通過徵詢超級預報員的意見來在COVID-19上做得更好? 這是可能的。 超級預測者 良好的判斷力 並在 形而上學 (我參加過)每個人似乎在 COVID-19 上都做得很好,Metaculus 聲稱 跑贏專家 就是在2020年XNUMX月。 最近系列 在與COVID-19相關的預測中,訓練有素的預報員並不總是比專家更準確。 調查背後的研究人員正在嘗試將領域專家和訓練有素的預測員的預測合併為“共識預測”的方法。

即使是幫助非超級公司做出更好預測的培訓也很有用,這似乎也是合理的。 例如,卡明斯聲稱,儘管流行病學模型受到了很多關注,但與模型假設相矛盾的證據——例如重症監護病房報告的數據——被忽略了。 似乎訓練有素的人“尋找與您當前的預測相抵觸的證據”似乎是合理的,這可能早些時候就已經發現了。

當然,並非所有文獻中的建議在政府環境中都是可行的。 從理論上講,政府可以自己採納這些建議,並採納任何看似有益的建議。 不幸的是,您無法改善無法衡量的內容。

In 超級預測, Tetlock 強調,任何認真改進其預測的組織都必須為其附上具體的數字,至少在內部是這樣。 諸如“嚴重可能性”之類的短語可能意味著一個人20%的機會,另一個人80%的機會。

幾乎可以肯定,這是卡明斯所指的 當他說:“一個叫Phil Tetlock的人寫了一本書,在那本書中,他說你不應該使用諸如合理,可能和可能之類的詞,因為這會使所有人感到困惑。” 如果沒有以能夠被評估的方式進行預測的組織沒有能力學習如何使它們變得更好,也許這並不會讓我們感到驚訝。 要改進,您首先必須嘗試。

關於作者

劍橋大學溫頓風險與證據交流中心研究助理Gabriel Recchia

相關書籍:

身體記錄分數:創傷癒合中的大腦和身體

作者:Bessel van der Kolk

這本書探討了創傷與身心健康之間的聯繫,提供了治療和恢復的見解和策略。

點擊了解更多信息或訂購

呼吸:失落藝術的新科學

通過詹姆斯·內斯特

這本書探討了呼吸的科學和實踐,提供了改善身心健康的見解和技巧。

點擊了解更多信息或訂購

植物悖論:導致疾病和體重增加的“健康”食品中的隱患

通過 Steven R. Gundry

這本書探討了飲食、健康和疾病之間的聯繫,提供了改善整體健康狀況的見解和策略。

點擊了解更多信息或訂購

免疫密碼:真正健康和徹底抗衰老的新範式

喬爾·格林

這本書提供了一個關於健康和免疫的新視角,借鑒了表觀遺傳學的原理,並提供了優化健康和衰老的見解和策略。

點擊了解更多信息或訂購

完整的禁食指南:通過間歇性、隔日和延長禁食來治愈您的身體

作者:Jason Fung 博士和 Jimmy Moore

本書探討了禁食的科學和實踐,提供了改善整體健康和保健的見解和策略。

點擊了解更多信息或訂購

這篇文章最初出現在 談話