當前,新冠病毒肺炎疫情在國內已經得到有效控制,復工復產正在全面推進之中。那么,目前經濟復蘇的情況究竟如何?各行各業以及各地區的發展形勢有何差異?百度公司最近發布的2篇論文 [1, 2] 研究發現,這些答案,都“藏”在海量的大數據里。
研究表明,百度地圖的用戶和商戶數據情況與GDP走勢呈現高度相關性,成為呈現行業和地區經濟復蘇情況的“晴雨表”。同時,百度地圖、搜索和健康平臺的數據顯示,某一地區人口流動情況以及搜索習慣,與該地區的疫情形勢緊密相關。由此可見,百度多維度大數據能夠有效地為疫情發展及其社會影響“畫像”。
中國傳媒大學調查統計研究所所長、大數據挖掘與社會計算實驗室主任沈浩表示,在抗擊新冠肺炎疫情的斗爭中,全國各地的政府、企業和科研機構都在探索運用大數據手段提升治理能力、加強抗疫效果。未來,百度的大數據不僅能夠作為政府防控疫情的有益參考,同時也可以為推動復工復產、提振經濟發展提供有力的決策依據。
L型、勾型、V型:百度大數據直觀量化疫情對經濟發展的沖擊情況 [1]
成都鬧市區的奶茶已經回歸了往日的熱鬧,而天津旅游景區的小飯館卻遲遲難以復蘇;西北縣城的超市恢復了元氣,長江中部的工廠則尚未將產量提升至疫情之前的平均水平……這些情況,百度大數據都“看”到了。
百度大數據的研究者在試圖摸清地圖數據與經濟復蘇情況的關聯時,發現了兩個關鍵因子——地圖用戶到店數量(Volumes of Visits to Venues,簡稱V3)與商戶新開設的地理位置點數量(New Venues Created,簡稱NVC)。V3可以反映用戶的活躍程度,NVC則反映商戶的活躍程度。
于是,研究者將這兩個數據的走勢與GDP走勢做成可視化圖表,結果發現,NVC、V3與GDP的走勢,呈現強烈的正相關,也就是說,地圖用戶到店的情況與商戶新開設的地理位置點情況,可以反映經濟活動的強弱。
圖1:從2018年第一季度到2020年第一季度,每個季度的國內GDP與百度地圖用戶到店數量,新開設的地理位置點數量,呈現強烈正相關。(注:分析所用的數據皆為脫敏數據,所有處理環節均不涉及個體隱私。下同。)
那么,這一發現,除了作為經濟活動的晴雨表,還有什么作用呢?
百度研究人員又做出了進一步的分析。他們對各個行業、各個地區省份的經濟活躍程度進行了細致分析,結果發現,不同行業、不同地區之間,經濟復蘇情況呈現巨大差異,主要分為以下三類——L型、勾型、V型。
先來看L型。這一曲線顯示復蘇緩慢,說明受疫情影響很大,目前仍然無法回到2018年同期的水平;教育、交通運輸、酒旅等行業遭受非常嚴重的打擊。下圖分別是機場、火車站、教育培訓機構、酒店的用戶到店情況。可以看到,代表今年情況的紅色V3曲線,呈現“L”形狀,依舊在低谷搖擺。
圖2:上圖為機場、火車站、教育培訓機構、酒店的用戶到店情況(V3)和新開設的地理位置點情況(NVC)
再來看勾型。雖遭受疫情影響,但是疫情緩和之后,能夠恢復到2018年與2019年同期之間的經濟水平。餐飲酒吧、休閑娛樂、公園景點等是典型的行業代表。這一復蘇情況在V3的可視化圖表里很像一個反寫的“對勾”。
圖3:勾型:疫情緩和之后,餐館酒吧、娛樂設施、旅游景點等行業能夠恢復到2018年與2019年同期之間的經濟水平
最后看V型。盡管疫情的影響嚴重,但是一旦疫情緩和之后,能夠快速觸底反彈,恢復到2019年同期水平,甚至比那時情況更好。代表行業有工作居住的地點、商超、醫院藥店等。
圖4:V型:疫情緩和之后,工作居住地點、商超、醫院藥店等景氣程度快速反彈,走勢看上去像字母V
研究人員用類似的思路,將全國經濟按照區域進行分析,發現湖北、北京及天津的經濟復蘇情況為L型,復蘇緩慢,與持續的疫情管控以及旅行限制有關;南部沿海、黃河中游、東部沿海、長江中游和北部沿海的數據顯示出明顯的勾型復蘇趨勢;大西北、東北和西南區域則展現出強勁的V型反彈趨勢。
百度大數據研究專家表示,五大經濟區(南部沿海,黃河中游,東部沿海、長江中游、北部沿海)高度依賴全球供應鏈的經濟,在國內疫情結束之后,依然受到國際整體疫情和經濟形勢的影響,未能快速反彈,呈現中間態的勾型;而西北、東北、西南等地區經濟對外依賴性相對較小,疫情感染人數沒有其他五大經濟區多,恢復快,經濟經歷短暫陣痛之后,觸底反彈。
搜索COVID-9越多,疫情防控工作越好?百度大數據“揭秘”疫情防治、人口遷徙與搜索行為間的顯著關聯 [2]
百度大數據還發現了人口出行情況、搜索情況與疫情防控之間的緊密關聯。
先來看第一項發現:從武漢移出到中國其他主要城市人口情況,與當地疫情傳染情況的關系存在顯著的正相關。
百度大數據統計了截至3月31日中國內地300個除湖北外主要城市的確診感染人數,將其與1月23日遷入該城市的人口數做出了對比。
圖5:截至2020年3月31日中國內地各主要城市確診人數 (上圖) /當地確診率 (下圖) vs 2020年1月1日至23日從武漢遷入人數
上面左圖展示了全國主要城市每個城市從武漢遷入人數(x-軸)與截止到3月31日當地累計確診人數(y-軸)的關聯。二者存在顯著正相關。說明,當地累計確診人數與當地遷入的武漢人數存在直接的關聯。
考慮到城市大小的關系,百度研究者也以當地感染率(每百萬人平均感確診人數)與從武漢遷入人數做出了分分析統計,如右圖。結果依然是顯著正相關。
由此可以得出結論——在武漢封城之前,從武漢遷入人口更多的城市,會有更高的感染人數;同理推斷,武漢越早采取封城措施,則疫情波及范圍越小。
再來看第二項研究結果。數據顯示,疫情越嚴重的地方,人均搜索COVID-19相關關鍵詞的次數也越多。
圖6:2020年1月33月31日中國大陸各主要城市人均COVID-19搜索次數 v.s 該城市確診人數 (上圖) /確診率(下圖)
可以看出,中國內地除湖北外主要城市確診感染人數與該城市人均搜索COVID-19相關關鍵詞的次數存在顯著正相關。由此得出結論,可能是由于感染情況引發的恐慌心理,人們更愿意搜索相關信息。
百度的研究還發現,全國除湖北外主要城市的出行恢復率與當地人通過百度搜索COVID-19次數呈現顯著的負相關。也就是說,人均通過百度搜索COVID-19關鍵字較多的城市,人們出行意愿更低、或是當地疫情管控措施更為嚴格 (在排除了其他潛在因素的偏相關性分析后,此關聯依然顯著)。
圖7:截至2020年3月31日中國大陸各主要城市出行恢復率 v.s 該城市人均COVID-19相關信息搜索次數:上圖(Log-Log Plot), 下圖正常尺度 。
可以看出,當人們主動搜索信息得到了更多有關疫情的消息時,便更愿意待在家里。可以說,百度數據對人口隔離政策和移動限制政策提供了重要參考。
大數據全面賦能疫情防控:真實掌握+有效預警+精準施策
從上數研究結果可以看出,百度地圖、搜索和健康的多維度數據能夠直觀呈現疫情發展及其社會影響。沈浩認為,百度大數據對于征服開展疫情防控與社會治理而言,有著突出意義。
其一,有利于全面、真實、動態掌握疫情防控情況。平時訪問發熱門診數量的人是否顯著增多?疫情期間居家隔離情況執行如何?百度都能夠第一時間給予直觀、真實的數據化呈現。
其二,對可能發生的疫情相關風險提出預警。百度地圖數據可以直接為疫情期間居家隔離政策、出行限制政策執行情況提供參考,對危險信號提出預警。
第三,動態掌復工復產、經濟發展的真實情況,形成真實全面的“景氣指數”。各地、各行業復工復產情況究竟如何?百度地圖的商戶和用戶活躍程度,便可以給予客觀的回應,作為政府機構精準施策的基礎。
利用大數據提升社會治理能力也是中國政府近年來不斷努力的方向。
2月18日,工業和信息化部印發了《關于運用新一代信息技術支撐服務疫情防控和復工復產工作的通知》,提出有效應用信息化手段助力疫情防控和復工復產。在中央精神的指導下,社會各界紛紛探索以信息化途徑高效開展疫情防控。
實際上,在新冠肺炎疫情發生之前,大數據在國內外公共衛生事件中的應用效果已經得到了較好的檢驗。此次疫情發生后,韓國、日本、新加坡等國家均采用了大數據手段防控疫情、指導經濟活動,取得了良好的效果。
在中國,相較17年前的SARS疫情,大數據在此次新冠疫情防控中的作用尤為明顯,涵蓋個人健康狀況認證、遠程醫療問診、應急物資調配等方方面面。
“互聯網公司掌握社會許多層面的數據,政府一方面要對數據的合規性加強監管,另一方面,也要積極利用互聯網公司的大數據,可以聯合科研院所和企業大數據機構協同進行大數據研究,助力疫情防控、應急管理和社會的精細化治理,為決策提供有益參考。”沈浩表示。