推文如何提供超級準確的早上流量預測

肖恩·錢(Sean Qian)說:“看到這種方法可以更好地預測早上5點以後的通勤交通量,這真是令人興奮,我相信可以在我們的許多運輸管理中心中迅速部署這種方法。” (信用: 快門轉輪/ Flickr)

研究人員已經使用從推文中提取的信息來提供無與倫比的準確性,以預測早晨的交通方式。

通勤時間是一天中最繁忙的時段之一; 然而,事實證明,這也是預測流量模式最困難的時間。 這是因為大多數交通量預測方法都依賴於從導致時間到預測期的一致的交通量數據流。

但是,大多數人會花一些時間在他們之前 改判 在家裡睡覺或早上做例行活動,在預測交通數據方面存在很大差距。

研究人員的方法通過從前一天晚上到第二天清晨之間發送的推文中提取數據來解決此問題。 他們首先使用Twitter的應用程序編程接口(API)來識別給定區域(在本例中為匹茲堡市)內的推文,並帶有指示其發送來源的地理標記。 然後,他們使用了另一個名為Twint(網絡抓取工具)的應用程序,該應用程序使用帶有地理標籤的推文從用戶那裡提取了其他帖子,以更好地了解該用戶活躍的時間和範圍。 在發布之前,所有數據都會被匿名化並刪除任何個人身份信息。


內在自我訂閱圖形


“我們認為推文捕獲了三類有用的信息,以解釋第二天的早晨交通情況,其中包括人們的睡眠-覺醒狀態,本地事件和(計劃中的)交通事件,”土木與環境工程學副教授肖恩·錢(Sean Qian)說,錢的博士生姚偉然(Weiran Yao)寫道。

該數據集的進一步擴充使研究人員能夠提取其他信息。 通過語言分析,團隊確定了可能表示交通事故的搜索詞。 這不僅包括事故,還包括計劃中的停業或大型活動,例如音樂會,體育比賽或節日慶典。

簡單的個人推文,例如“在海盜遊戲中大放異彩!” 或“前面的擋泥板彎彎機會讓我遲到”,實際上可以提供關鍵信息,尤其是在貼有地理標籤或來自該用戶的其他推文中。 還從官方媒體(如新聞媒體和地方政府)中提取了進一步的數據,這些官方媒體經常在推特上發布有關事故和計劃關閉的直接報導。

結合使用時,這些方法可提供大量信息,表明可能的地理分佈和睡眠/喚醒時間 通勤者,以及可能影響通勤的計劃內交通事故和意外交通事故。 這彌合了通宵交通停頓造成的信息鴻溝。

有了這些信息,錢和姚就能夠以前所未有的準確性提供匹茲堡早上上下班期間的交通預測,並創建了一個全面的框架來預測城市的早上交通狀況 地區.

這些信息還使他們能夠開始在更大的日常範圍內進行觀察和預測。 這包括發現匹茲堡的早上交通通常在星期二,星期三和星期四比較擁擠,這可以使運輸機構更好地管理早上的通勤。 由於無法準確預測早晨的狀況,這種觀察以前是不可能的,可能會在旅行需求管理,信號定時控制和個人目的地路線選擇方面做出更大的決策。

錢謙說:“這項研究利用機器學習和大數據來理解人類行為,同時保護個人隱私。”

“看到這種方法可以更好地預測早上5點之前的通勤流量,這真是令人興奮,我相信可以在我們的許多運輸管理中心中迅速部署這種方法。”

關於作者

他們的結果出現在 交通研究。 - 原始研究

打破

相關書籍:

原子習慣:建立良好習慣和打破不良習慣的簡便方法

由James Clear

Atomic Habits 基於對行為改變的科學研究,為養成好習慣和改​​掉壞習慣提供實用建議。

點擊了解更多信息或訂購

四種傾向:揭示如何讓你的生活更美好(以及其他人的生活也更美好)的不可或缺的性格特徵

通過格雷琴·魯賓

四種傾向確定了四種人格類型,並解釋了了解自己的傾向如何幫助您改善人際關係、工作習慣和整體幸福感。

點擊了解更多信息或訂購

再想一想:知道你不知道的力量

通過亞當·格蘭特

Think Again 探索了人們如何改變他們的思想和態度,並提供了改進批判性思維和決策制定的策略。

點擊了解更多信息或訂購

身體保持得分:創傷治療中的大腦,思想和身體

作者:Bessel van der Kolk

The Body Keeps the Score 討論了創傷與身體健康之間的聯繫,並提供了關於如何治療和治癒創傷的見解。

點擊了解更多信息或訂購

金錢心理學:關於財富、貪婪和幸福的永恆教訓

通過摩根豪塞爾

金錢心理學研究了我們對金錢的態度和行為如何影響我們的財務成功和整體幸福感。

點擊了解更多信息或訂購