這是時代的光芒一盞燈的算法,電力大哥

按算法排序將我們放在盒子裡。 我們怎麼知道它們是正確的? 生成,CC BY按算法排序將我們放在盒子裡。 我們怎麼知道它們是正確的? 生成,CC BY

社會似乎已經走上了一條道路,我們的生活受到計算機算法的嚴格審查。 無論是政府為國家安全還是利潤公司,我們生成的數據都經過仔細研究和分析,這種情況不太可能改變 - 數據分析的力量和吸引力一旦被發現,就不會輕易放棄。

但實際上我想知道我是否更關心我們的數據是在收集,還是因為我們對判斷我們的算法一無所知。

我們之前已經討論過可以從我們留下的數據中刪除的關於我們的生活和習慣的詳細程度,並且正在圍繞英國草案進行辯論的一部分。 調查權力法案。 我們至少知道收集哪些數據以及存儲多長時間,其中一些數據受英國和歐洲法律管轄。

法案草案案文例如,我們知道英國政府將“僅”要求(無根據)訪問通信元數據,電子郵件的標題和主題以及電話記錄。 但我們也知道單獨展示元數據的方式:看一看 麻省理工學院媒體實驗室的浸入式項目 這是一個有力的例子,可以從中確定多少細節。 這當然是 不是在所有可比的逐項手機話費如所聲稱的那樣。

所以無論好壞,我們,公眾,都有一些關於記錄內容的線索。 但我們完全不知道對這些數據應用了哪些分析工具和技術 - 這一點的重要性不容小覷。

什麼破壞數字?

我們可以做出有根據的猜測。 國家安全機構可能會利用我們的元數據在人與地之間建立社交網絡,其中包括將我們聯繫在一起。 然後將對這些關係網絡進行分析,以確定我們是否是感興趣的人,由您與其他感興趣的人進行比較以及如何與現有的人或與他們相關的人聯繫起來。

使用這些技術的研究人員了解其局限性,並且為其提供動力的算法可能包含對其輸出產生深遠影響的錯誤或潛在假設。 在這種情況下,這可能意味著您是否被標記為恐怖分子,或者您是否有資格獲得貸款或抵押貸款。


從InnerSelf獲取最新信息


在模糊邊界區域中定義關係的存在的位置也不完全清楚。 簡單地訪問與恐怖分子相同的網站是否意味著共同的價值觀,或者每天乘坐同一條公共汽車路線,是否經常與恐怖分子交談? 出於許多正當理由,很有可能訪問已知恐怖分子經常光顧的地點。 如果你從恐怖分子的同一網站得到你的新聞,你更有可能成為恐怖分子嗎? 歧視和偏見 可以在數據收集時引入,然後在決定如何分析數據時再次引入。 算法也可以區別對待。

模糊的邊界

算法引入不良偏差的可能性是非常真實的。 例如,安全部門使用的那些訓練有關已知恐怖分子和已知非恐怖分子的數據集。 這是否意味著, 眾所周知的恐怖分子是20-30的男性,你更有可能被歸類為僅僅是男性和大約20-30的恐怖分子,無論你的其他屬性如何? 如果是這樣,這對數據的使用方式有顯著影響嗎?

問題源於我和其他使用複雜網絡分析,機器學習,模式匹配或人工智能技術的學術研究人員使用這些技術進行公開同行評審,以確定技術的強度和結論的有效性; 政府安全部門和私營部門組織沒有。 我們不知道他們的方法的質量以及他們如何部署它們。 這個問題有方法解決嗎?

那些來自另一個安全領域,密碼學的人很久以前就知道,提高算法質量和安全性的最佳方法是將它們公之於眾。 發布了加密實現和密碼,鼓勵研究人員嘗試查找錯誤或缺陷,從而提高所有使用它們的安全性。 另外,通常是閉源(非公共)密碼算法的任何實現 持懷疑態度。 如果他們要向我們發出改變生活的判斷 - 無論我們被標記為恐怖分子還是經濟上不值得 - 同樣的模型應該應用於安全算法。

反對這一舉動的論點是,開放和透明的算法可能會導致恐怖分子修改他們的現實行為,以避免被發現。 這意味著改變他們的互動,聯想,瀏覽習慣和可能的動作。 但是,如果算法運作正常,那將意味著他們基本上不再像恐怖分子那樣行事。 如果我們未來的安全性,自由性和安全性將依賴於這些算法,那麼我們必須確切地確定它們是如何工作的。

關於作者談話

Philip Garnett,約克大學講師。

這篇文章最初發表於 談話。 閱讀 原創文章.

相關圖書:

{amazonWS:searchindex =叢書;關鍵字= 0393244814;的maxResults = 1}

enafarZH-CNzh-TWnltlfifrdehiiditjakomsnofaptruessvtrvi

關注InnerSelf

Facebook的圖標Twitter的圖標RSS圖標

通過電子郵件獲取最新信息

{emailcloak = OFF}