如果你快樂或悲傷,互聯網如何知道

快樂或悲傷的5 28

想想你今天在Facebook上與朋友分享的內容。 是“壓力”還是“失敗”,或者“喜悅”,“愛”或“興奮”的感覺? 每次我們在社交媒體上發帖時,都會留下我們心情的痕跡。 談話

我們的情緒是有價值的商品,許多公司正在開發自動化工具,以便在稱為情緒分析的過程中識別它們。

最近,一份洩露的報導 發現 Facebook可以識別年輕人何時感到脆弱,儘管公司有 堅持說它沒有使用分析 用廣告定位用戶。 Facebook的 也道了歉 在2014中 實驗 在“情緒感染”中,從用戶的飼料中過濾出具有“積極”或“消極”情緒的帖子。

顯然,社交媒體公司以及廣告商都非常關注從文本中檢測情緒的能力。 但情緒分析如何運作,為什麼它有用,有什麼危險?

情緒分析如何運作?

儘管Facebook自己的算法的細節尚未公開,但大多數情緒分析技術分為兩類:監督或無監督。

監督方法依賴於標記數據。 換句話說,這些是手動分類為包含正面或負面情緒的帖子。

然後使用統計方法訓練模型以基於預先識別的單詞或短語的存在自動地對新帖子進行分類,例如“壓力”或“放鬆”。

另一方面,無監督方法通常依賴於為不同單詞構建分數字典。 一個這樣的字典 由我的合作者開發,要求人們給1 9幸福得分用不同的單詞,然後平均結果:“彩虹”,例如,得分8.06,而“無用”獲得2.52。

然後,通過查看帖子中的所有單詞,可以對短語的整體情緒進行評分。 例如,根據這本詞典,“My momma總是說'生活就像一盒巧克力'”的平均得分是高於平均水平的6.02,這表明它表達了積極的感覺。

什麼是情緒分析?

市場營銷人員越來越多地使用情感分析 研究趨勢並提出產品建議.

想像一下新手機的發布; 關於手機的社交媒體帖子的情緒分析可能會讓公司有價值,實時地了解它的表現。

情緒分析有更廣泛的應用。 研究人員最近 跟踪唐納德特朗普在他擔任總統的第一個100日的推特情緒 - 建立機器人來進行市場交易 當他對特定公司做出積極或消極的推文時。

科學家也可以追踪其他文本中的情緒趨勢。 例如,我們使用情感分析來通過他們的劇本來研究超過1,000電影的情感弧度。 2013迪士尼電影“冰雪奇緣”的弧線如下所示。

隱私 電影“冰雪奇緣”的情感弧線。

許多電影都表現出類似的模式:緊張和釋放的常規高峰和低谷,接著是通過電影的特別大的低谷80%(所有希望都失去了!),在最終決議和快樂的結局之前。 我們對小說進行了類似的分析 大多數故事都遵循六個基本故事中的一個.

我們在情緒分析方面仍然不太好

鑑於情緒分析通常依賴於挖掘社交媒體帖子,因此引發了重大的道德問題 這場辯論才剛剛開始。 然而,語言和意義的複雜性使其容易出錯。

採用“願力與你同在”這句話,使用我們的詞典分析得分5.35。 對於任何星球大戰的粉絲來說,它當然是一個非常積極的短語,但它在我們的測試中得分適中,因為“力”這個詞被評為低於平均水平的4.0。

在單獨評估這個單詞時這是可以理解的,但在上下文中它沒有多大意義。

因此,有必要對Facebook的情緒分析能力的有效性持懷疑態度。 完全可以想像,在Facebook上描述一些“完全生病”的東西,這是一個口語代言的短語,可能會導致個人的情緒狀態被錯誤分類。

要了解情緒分析何時起作用和不起作用,檢查推動特定結果的單詞非常重要。

為此,我們使用“換班“圖表,如下面的凍結圖。 這表明哪些詞語使得劇本的高潮比其快樂的結局更令人悲傷:更多地提到“悲傷”和“恐懼”,但奇怪的是,更“美麗”。

隱私 將冷凍的高潮與其快樂的結局進行比較。 圖表頂部的藍色條顯示了得分差異的最高貢獻詞。

承諾和警告

情感分析是一個強大的工具,但它只是一個年輕的科學,必須謹慎使用。

科學家們必須開發出一些工具,使我們能夠“深入了解”並了解為什麼某些算法可以產生他們所做的結果。 這是用不同方法診斷問題的唯一方法,更重要的是,向公眾宣傳該領域的可能性和局限性。

情感分析研究主要基於大型公共數據集,尤其是社交媒體。 重要的是,我們這些人無意中提供了數據,了解它能夠和不能用於什麼,以及如何使用。

關於作者

Lewis Mitchell,阿德萊德大學應用數學講師。 米歇爾愛德華茲為本文做出了貢獻。

這篇文章最初發表於 談話。 閱讀 原創文章.

相關書籍:

{amazonWS:searchindex = Books; keywords = internet privacy; maxresults = 3}

enafarZH-CNzh-TWtlfrdehiiditjamsptrues

關注InnerSelf

Facebook的圖標Twitter的圖標RSS圖標

通過電子郵件獲取最新信息

{emailcloak = OFF}