YouTube的算法可能激怒人們-但真正的問題是我們不知道他們如何工作 Tempter先生/ Shutterstock

YouTube是否會創建極端分子? 一種 最近的一項研究 在科學家之間引起爭議,他們認為支持該網站的算法並不能通過推薦更多極端視頻來幫助激怒人們,例如 已經提出 最近幾年。

該論文提交給開放存取期刊《第一星期一》,但尚未經過正式同行評審,分析了不同類型渠道收到的視頻推薦。 它聲稱YouTube的算法優先於主流媒體渠道,而不是獨立的內容,並認為激進化與創建有害內容的人更多的是網站的算法。

該領域的專家很快 回應研究,有些批評 論文的方法 和其他人爭論算法是其中之一 幾個重要因素 還有那個數據科學 不會給我們答案.

這次討論的問題在於,由於我們不了解YouTube的算法在激進化人們方面所起的作用,因此我們無法真正回答該問題。 這只是更廣泛問題的徵兆。 這些算法在我們的日常生活中起著越來越重要的作用,但缺乏任何透明度。

很難說YouTube在激進化中沒有發揮作用。 技術社會學家Zeynep Tufekci首先指出了這一點,他說明了推薦視頻如何逐步吸引用戶 追求更極端的內容。 用Tufekci的話說,有關慢跑的視頻會導致有關進行超級馬拉鬆的視頻,有關疫苗的視頻會導致陰謀論,而有關政治的視頻則導致“大屠殺否認和其他令人不安的內容”。


內在自我訂閱圖形


這也被寫成 詳細 前YouTube員工Guillaume Chaslot負責該網站的推薦算法。 自離開公司以來,Chaslot一直在努力提出這些建議 更透明。 他說YouTube建議偏向 陰謀論和實際上不正確的視頻,但仍使人們在網站上花費更多的時間。

事實上, 最大化觀看時間 是YouTube算法的重點,這鼓勵視頻創作者以任何可能的方式爭取關注。 公司的純粹 缺乏透明度 確切地講這是如何工作的,因此幾乎不可能在網站上進行激進化。 畢竟,如果沒有透明度,很難知道可以為改善情況而做出哪些改變。

YouTube的算法可能激怒人們-但真正的問題是我們不知道他們如何工作 YouTube算法的工作原理仍然是個謎。 誰是Danny / Shutterstock

但是YouTube在這方面並不罕見。 每當算法在大型系統中使用時(無論是由私人公司還是公共機構使用),其算法如何工作都缺乏透明度。 除了決定接下來要播放的視頻之外,機器學習算法現在還可以用來 讓孩子上學, 決定 監禁,確定 信用評分保險費率以及命運 移民, 求職者大學申請者。 通常我們不了解這些系統如何做出決定。

研究人員找到了創新的方法來展示這些算法對社會的影響,無論是通過研究 反動權利的上升 或者 陰謀論的傳播 或在YouTube上展示如何 搜索引擎反映了種族偏見 創造它們的人。

機器學習系統通常是大型,複雜且不透明的。 適合地,它們通常被描述為 黑匣子,信息進入其中,信息或動作出現,但沒人能看到兩者之間發生了什麼。 這意味著,由於我們不完全了解YouTube推薦系統之類的算法的運行方式,因此試圖弄清楚網站的工作原理就像在不打開引擎蓋的情況下理解汽車。

反過來,這意味著試圖編寫法律來規範應該執行或不應該執行的算法將成為盲目的過程或反複試驗。 YouTube和許多其他機器學習算法就是這種情況。 我們試圖在他們的結果中有發言權,而不真正了解他們的實際工作方式。 我們需要開放這些專利技術,或者至少使它們足夠透明以至於我們可以對其進行監管。

解釋和測試

一種方法是讓算法提供 反事實的解釋 以及他們的決定。 這意味著要計算出算法做出不同決策所需的最低條件,而無需描述其完整邏輯。 例如,決策銀行貸款的算法可能會產生這樣的輸出:“如果您年滿18歲且沒有以前的債務,則您將接受銀行貸款”。 但這對於使用推薦算法的YouTube和其他網站可能很難做到,因為從理論上講,可以隨時推薦平台上的任何視頻。

另一個功能強大的工具是算法測試和審核,在診斷偏差算法中特別有用。 在最近的案例中,一家專業的簡歷篩選公司發現其算法是 優先考慮兩個因素 作為工作績效的最佳預測指標:候選人的名字是否是Jared,以及他們是否在高中打過曲棍球。 這是在機器不受監督的情況下發生的情況。

在這種情況下,簡歷篩選算法已經註意到白人被錄用的可能性更高,並且發現在所錄用候選人中存在相關的代理人特徵(例如被任命為Jared或打長曲棍球)。 借助YouTube,算法審核可以幫助您了解哪些視頻應優先考慮進行推薦-也許可以幫助解決有關YouTube建議是否有助於激進化的爭論。

引入反事實的解釋或使用算法審核是一個困難而昂貴的過程。 但這很重要,因為替代方案更糟。 如果算法不受控制,不受管制,我們就會看到陰謀理論家和極端主義者逐漸滲透到我們的媒體中,而我們的注意力將由能夠產生最有利可圖的內容的人控制。談話

關於作者

Chico Q. Camargo,數據科學博士後, 牛津大學

本文重新發表 談話 根據知識共享許可。 閱讀 原創文章.