這不只是一個社交媒體問題-搜索引擎如何傳播錯誤信息搜索引擎通常會混淆信息和錯誤信息。 克里斯平·瓦萊恩特(Crispin la valiente)/ Moment通過Getty Images, CC BY-ND

搜索引擎是社會通往信息和人的主要途徑之一,但它們也是錯誤信息的渠道。 如同 有問題的社交媒體算法,搜索引擎將學會為您提供您和他人之前點擊過的內容。 由於人們被轟動的感覺所吸引,因此算法與人性之間的這種舞蹈會助長錯誤信息的傳播。

像大多數在線服務一樣,搜索引擎公司不僅通過出售廣告,還通過跟踪用戶並出售其數據來獲利。 通過實時出價 在上面。 人們渴望獲得具有轟動性和娛樂性的新聞以及具有爭議性或證實其觀點的信息,往往會導致誤導信息。 一項研究發現,關於糖尿病的YouTube視頻越來越流行 不太可能具有醫學上有效的信息 比不那麼受歡迎的影片。

廣告驅動的搜索引擎(例如社交媒體平台)旨在獎勵誘人鏈接的點擊,因為它可以幫助搜索公司提高其業務指標。 作為研究者 研究搜索和推薦系統,我和我的同事們表明,公司獲利動機與個人敏感性之間的這種危險結合 使問題難以解決.

搜索結果如何出問題

當您單擊搜索結果時,搜索算法將得知您單擊的鏈接與您的搜索查詢相關。 這就是所謂的 相關性反饋。 該反饋有助於搜索引擎將來為該查詢賦予該鏈接更高的權重。 如果足夠多的人單擊該鏈接足夠多次,從而提供了強大的相關性反饋,則該網站的搜索結果和相關查詢的排名會更高。


內在自我訂閱圖形


人們是 更有可能點擊顯示在較高位置的鏈接 在搜索結果列表中。 這會形成一個積極的反饋循環-網站展示的頻率越高,點擊次數就越多,進而使該網站向更高或更高的方向移動。 搜索引擎優化技術使用此知識來增加網站的可見性。

這個錯誤信息問題有兩個方面:如何評估搜索算法以及人類對標題,標題和摘要的反應。 像大多數在線服務一樣,搜索引擎是使用一系列指標來判斷的,其中之一就是用戶參與度。 為您提供想要閱讀,觀看或單擊的內容,這是搜索引擎公司的最大利益。 因此,當搜索引擎或任何推薦系統創建要顯示的項目列表時,它將計算您單擊這些項目的可能性。

傳統上,這是為了帶出最相關的信息。 但是,相關性的概念變得模糊,因為人們一直在使用搜索來查找 有趣的搜索結果以及真正相關的信息.

想像您正在尋找鋼琴調音器。 如果有人向您展示了一隻貓在彈鋼琴的視頻,您會點擊它嗎? 即使與鋼琴調音無關,許多人也會這樣做。 這項搜索服務受到了積極的相關反饋的認可,並發現人們在搜索鋼琴調音器時可以顯示一隻貓在彈鋼琴。

實際上,它比在許多情況下顯示相關結果更好。 人們喜歡看有趣的貓咪視頻,而搜索系統獲得了更多的點擊次數和用戶參與度。

這似乎無害。 那麼,如果人們不時分心並點擊與搜索查詢無關的結果怎麼辦? 問題在於,人們被令人興奮的圖像和聳人聽聞的標題所吸引。 他們 傾向於點擊陰謀論和聳人聽聞的新聞,而不僅僅是貓在彈鋼琴 不僅僅是點擊真實新聞 或相關信息。

著名但假的蜘蛛

2018年,搜索“新的致命蜘蛛” 釘在Google上 在Facebook帖子上聲稱有一隻新的致命蜘蛛在多個州殺死了幾人之後。 在此趨勢查詢的第一周,我和我的同事分析了Google搜索“新致命蜘蛛”的前100個結果。

這不只是一個社交媒體問題-搜索引擎如何傳播錯誤信息2018年XNUMX月,谷歌針對``新致命蜘蛛''的搜索結果的前兩頁(陰影區域)與該主題的原始虛假新聞帖子有關,而不涉及揭穿或其他事實信息。 希拉格·沙(Chirag Shah), CC BY-ND

原來這個故事 是假的,但搜尋該郵件的人在很大程度上暴露了與原始虛假帖子有關的錯誤信息。 當人們繼續單擊並共享該錯誤信息時,Google會繼續在搜索結果的頂部提供這些頁面。

這種令人興奮且未經驗證的故事不斷湧現,人們點擊它們的模式仍在繼續,人們顯然要么不關心事實,要么相信如果可信的服務(例如Google搜索)向他們展示這些故事,那麼這些故事就必須是真實的。 最近,一個 拒登報告 據稱,由於這種惡性循環,中國讓實驗室的冠狀病毒洩漏在搜索引擎上引起了人們的關注。

發現錯誤信息

為了測試人們對準確信息和錯誤信息的區分程度,我們設計了一個簡單的遊戲,稱為“谷歌與否。” 此在線遊戲顯示同一查詢的兩組結果。 目標很簡單–選擇可靠,可信賴或最相關的集合。

這不只是一個社交媒體問題-搜索引擎如何傳播錯誤信息在測試中,大約有一半的時間人們無法分辨包含錯誤信息的Google搜索結果與僅包含可信賴結果的搜索結果之間的區別。 希拉格·沙(Chirag Shah), CC BY-ND

這兩組中的一組具有一個或兩個結果,這些結果已被驗證並標記為錯誤信息或被揭穿的故事。 我們公開發布了該遊戲,並通過各種社交媒體渠道進行了廣告宣傳。 總體而言,我們從2,100多個國家/地區收集了30份回复。

當我們分析結果時,我們發現 大約有一半的時間,人們錯誤地選擇了帶有一兩個錯誤信息結果的集合,作為值得信賴的集合。 我們在許多次迭代中與數百個其他用戶進行的實驗也得出了類似的發現。 換句話說,大約有一半的時間人們在選擇包含陰謀論和虛假新聞的結果。 隨著越來越多的人選擇這些不准確和誤導性的結果,搜索引擎發現這就是人們想要的。

除了關於大技術監管和自我監管的問題外,對於人們來說,重要的是要了解這些系統如何工作以及如何賺錢。 否則,市場經濟和人們天生的傾向會被吸引眼球的鏈接所吸引,這將使惡性循環繼續下去。

關於作者

信息科學副教授Chirag Shah, 華盛頓大學

本文重新發表 談話 根據知識共享許可。 閱讀 原創文章.