差異隱私如何保護您的數據? Marco Verch / Flickr, CC BY 

技術公司可以使用差異隱私來收集和共享有關用戶習慣的匯總數據,同時保持個人隱私。

眾所周知,像Facebook,谷歌,蘋果和亞馬遜這樣的大型科技公司正在越來越多地滲透我們的個人和社交互動,以便每天收集大量數據。 與此同時,網絡空間中的隱私侵權行為經常成為頭版新聞。

那麼,在一個以越來越快的速度和獨創性收集和共享數據的世界中,如何保護隱私呢?

差異隱私是一種新的網絡安全模型,支持者聲稱可以比傳統方法更好地保護個人數據。

它所基於的數學是多年前開發的10,並且該方法已被Apple和 谷歌 最近幾年。


內在自我訂閱圖形


什麼是差異隱私?

差異化隱私使技術公司可以收集和共享有關用戶習慣的匯總信息,同時保持個人用戶的隱私。

例如,假設您想要展示人們在公園散步時最受歡迎的路線。 您可以追踪經常穿越公園的100人的路線,以及他們是走在路上還是在草地上漫步。

但是,您可以共享隨時間收集的匯總數據,而不是共享每條路線的特定人員。 查看結果的人可能知道60人中的100喜歡在草地上採取捷徑,而不是60人。

我們為什麼需要它?

許多世界政府對科技公司如何收集和共享用戶數據有嚴格的政策。 不遵守規則的公司可能面臨巨額罰款。 一個 比利時法院最近下令Facebook 停止在外部網站上收集用戶瀏覽習慣的數據,或者每天面臨250,000歐元的罰款。

對於許多公司,尤其是在不同司法管轄區運營的跨國公司而言,這使得他們在收集和使用客戶數據時處於微妙的位置。

一方面,這些公司需要用戶的數據,以便他們能夠提供有益於用戶的高質量服務,例如個性化推薦。 另一方面,如果他們收集過多的用戶數據,或者他們試圖將數據從一個司法管轄區移動到另一個司法管轄區,他們可能會面臨指控。

傳統的隱私保護工具(如加密技術)無法解決這一難題,因為它會阻止科技公司訪問數據。 匿名性會降低數據的價值 - 如果算法不知道您的習慣是什麼,則算法無法為您提供個性化建議。

它如何運作?

讓我們繼續通過公園步行路線的例子。 如果你知道研究中包含的那些人的身份,但你不知道誰走了哪條路線那麼你可能會認為隱私受到保護。 但情況可能並非如此。

假設有人查看您的數據想要確定Bob是否喜歡穿過草地或路徑。 他們已經獲得了研究中其他99人的背景信息,告訴他們40人喜歡走在路上,而59喜歡穿過草地。 因此,他們可以推斷,作為數據庫中100th人的Bob是喜歡穿過草地的60th人。

這種類型的攻擊被稱為差異化攻擊,並且很難防禦,因為您無法控制某人可以獲得多少背景知識。 差異隱私旨在抵禦此類攻擊。

有人推斷你的步行路線可能聽起來不太嚴重,但如果你用HIV測試結果取代步行路線,那麼你可以看到有可能嚴重侵犯隱私。

差異隱私模型保證即使某人在數據集中擁有關於99人100的完整信息,他們仍然無法推斷出有關最終人的信息。

實現這一目標的主要機制是將隨機噪聲添加到聚合數據中。 在路徑示例中,您可能會說喜歡越過草地的人數是59或61,而不是60的確切數量。 不准確的數字可以保護鮑勃的隱私,但它對模式的影響很小:大約60%人們更喜歡採取捷徑。

噪音經過精心設計。 當Apple在iOS 10中使用差異隱私時,它會增加個人用戶輸入的噪音。 這意味著它可以跟踪,例如,最常用的表情符號,但屏蔽任何個人用戶的表情符號用法。

Cynthia Dwork, 差異隱私的發明者,提出了多少噪聲足以達到差別隱私要求的精彩數學證明。

它的實際應用是什麼?

差異隱私可應用於從推薦系統到基於位置的服務和社交網絡的所有內容。 蘋果 使用差異隱私 從iPhone,iPad和Mac等設備收集匿名使用見解。 該方法是用戶友好的,並且 合法地在清楚.

差異隱私還允許像亞馬遜這樣的公司訪問您的個性化購物偏好,同時隱藏有關您的歷史購買列表的敏感信息。 Facebook可以使用它來收集針對性廣告的行為數據,而不會違反國家的隱私政策。

怎麼可以在將來使用?

不同的國家/地區有不同的隱私政策,敏感文檔目前必須在從一個國家遷移到另一個國家之前進行人工檢查。 這是耗時且昂貴的。

最近,一個團隊來自 迪肯大學 開發差異化隱私技術,以實現各國雲共享社區內隱私流程的自動化。

談話他們建議使用數學公式來模擬每個國家的隱私法律,這些法律可以轉換為“中間件”(軟件)以確保數據符合要求。 以這種方式使用差異隱私可以保護用戶的隱私並解決科技公司的數據共享問題。

關於作者

朱天慶,科學,工程與建築環境學院網絡安全講師, 迪肯大學

這篇文章最初發表於 談話。 閱讀 原創文章.

相關書籍

at InnerSelf 市場和亞馬遜